[Reuters] single-label, multiclass classification AI
·
Artificial_Intelligence🤖/Natural Language Processing
#시작 로이터(Reuters) 뉴스 데이터셋으로 단일 레이블 다중 분류 문제 다루기 목적 : 텍스트 분류 11258개의 기사와 46개의 뉴스 카테고리 분류. 각 토픽은 최소 10개이상의 샘플이 있음. from keras.datasets import reuters (train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words = 10000) #로이터 데이터셋 가져오고 각 데이터를 변수에 넣어줌 #훈련용데이터와 검증용 데이터 몇개로 분류되었는지 출력. print(len(train_data)) print(len(test_data)) print(train_data[1]) #2차원 배열로 들어가있음 print(train_labe..