[Reuters] single-label, multiclass classification AI
·
Artificial_Intelligence🤖/Natural Language Processing
#시작 로이터(Reuters) 뉴스 데이터셋으로 단일 레이블 다중 분류 문제 다루기 목적 : 텍스트 분류 11258개의 기사와 46개의 뉴스 카테고리 분류. 각 토픽은 최소 10개이상의 샘플이 있음. from keras.datasets import reuters (train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words = 10000) #로이터 데이터셋 가져오고 각 데이터를 변수에 넣어줌 #훈련용데이터와 검증용 데이터 몇개로 분류되었는지 출력. print(len(train_data)) print(len(test_data)) print(train_data[1]) #2차원 배열로 들어가있음 print(train_labe..
[IMDB] Sentiment Analysis AI
·
Artificial_Intelligence🤖/Natural Language Processing
# IMDB란 인터넷 영화 데이터베이스(Internet Movie Database, 약칭 IMDB)이다. 우리가 사용할 데이터는 영화 사이트 IMDB의 리뷰 데이터이다. 이 데이터는 리뷰에 대한 텍스트와 해당 리뷰가 긍정인 경우 1, 부정인 경우 0으로 표시한 레이블로 구성된 데이터이다. 이 데이터셋은 케라스에서 import하여 바로 사용할 수 있다. 이 데이터셋을 사용하여 머신러닝을 제작할 것이다. 목적은 텍스트 분류, 그 중에서도 감성 분류를 연습하기위함에 있다. 여기서 감성 분류(Sentiment Analysis)란, 텍스트 안에 들어있는 여러가지 주관적인 정보(의견, 감성, 평가, 태도 등)을 머신러닝을 돌려 분석하는 것이다. #입력 데이터 불러오기 #케라스의 데이터셋에 있는 IMDB를 불러온다...
[RNN] 전염병(covid-19) 예측 인공지능 제작
·
Artificial_Intelligence🤖/Prediction
colab.research.google.com/drive/1925aJnKBtplTrvAv0TfYbdjumcEnAPON?usp=sharing Google Colaboratory colab.research.google.com 코랩으로 작성한 원문입니다. # 개발 시작 이전 며칠간의 확진자 수를 입력받아 다음 날의 확진자 수를 예측하는 방법. 3일 동안의 확진자 수 보고, 그 다음날 확진자 수가 어떻게 될지 학습함. ex) 1, 2, 3 일 차 확진자 -> 4일차 확진자 예측. 연속된 데이터의 형태에서 그 패턴을 찾아냄. 순환 신경망 방식 (RNN). (RNN = Recurrent Neural Network, 순환적 구조, 입출력을 시퀀스 단위로 처리.) from keras.models import Seque..
[TensorFlow] 숫자 인식 AI 제작 (2)
·
Artificial_Intelligence🤖/Computer Vision
colab.research.google.com/drive/1vcBfl192NDGJ2_c2u01tAa65NGSJmrw8?usp=sharing Google Colaboratory colab.research.google.com 원문입니다. 코랩으로 보는거 추천. (이전글) 2021/01/28 - [Hi/AI] - [TensorFlow] 숫자 인식 AI 제작 (1) # 모델설계 4개의 층으로 만들거임. 입력층, 은닉층, 은닉층, 출력층 입력층 뉴런의 수는 28 * 28이니 784임. 28 * 28개의 픽셀로 이루어진 숫자를 한줄로 바꾼거임. 첫번째 은닉층의 노드 수는 512개, 두번째 은닉층의 노드 수는 256개, 세번째 결과층의 노드수는 10개로 설정함. (마지막은 0~9이니 10개) 활성화 함수는 렐루(Re..
Liky
'keras' 태그의 글 목록