Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 회귀분석
- student t분포
- 가설검정
- 최소자승법
- 히스토그램
- 군집화
- 기술통계학
- 모두의 딥러닝
- 구글 BERT의 정석
- 머신러닝
- 코사인 유사도
- 파이썬 pandas
- 밑바닥부터 시작하는 딥러닝
- Django
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- 차원축소
- 결정계수
- 다층 퍼셉트론
- 은준아 화이팅
- 감성분석
- Pandas
- 오래간만에 글쓰네
- rnn
- 밑바닥부터 시작하는 딥러닝2
- 기초통계
- 텍스트 분류
- F분포
- word2vec
- numpy
- 자연어 처리
Archives
- Today
- Total
데이터 한 그릇
자연어 처리 개요_텍스트 분류 본문
자연어 처리 개요_텍스트 분류(Text Classification)
자연어 처리 기술을 통해,
특정 텍스트를 사람들이 지정한 몇 가지 범주(class) 중에 어디 속하는지 분류하는 문제.
이 텍스트는 어떤 범주에 들어갈까?
텍스트 분류 문제는 class 가 두 개인 이진 분류 문제일수도 있고 class 가 여러 개인 다중 분류 문제일수도 있다.
텍스트 분류의 예시
스팸 분류
이진분류 문제.
이 메일이 스팸이냐 스팸이 아니냐?
감정 분류
이 글이 긍정적인 글이냐 부정적인 글이냐?
경우에 따라는 이진 분류 문제가 아니라 다중 분류 문제일수도 있다. ''중립'' 을 추가해서.
뉴스 기사 분류
이 글이 어떤 주제에 속하는가?
(스포츠, 연예, 정치, 경제 등등)
그렇다면 텍스트 분류 문제는 어떻게 해결할 수 있을까!!?
지도 학습을 통한 텍스트 분류
종류
- 나이브 베이즈 분류
- 서포트 벡터 머신
- 신경망
- 선형 분류
- 로지스틱 분류
- 랜덤 포레스트
비지도 학습을 통한 텍스트 분류
- k-평균 군집화
- 계층적 군집화
이외에도 딥러닝을 활용한 텍스트 분류 작업도 진행된다.
즉, 텍스트 분류의 방식에는, 지도학습의 머신러닝, 비지도 학습의 k-평균, 계층적 군집화 그리고 딥러닝 활용이 있다.
'NLP > 텐서플로2와 머신러닝으로 시작하는 자연어처리' 카테고리의 다른 글
텍스트 분류(2) - 다양한 모델링 기법 (0) | 2022.01.27 |
---|---|
텍스트 분류(1) - 텍스트 데이터 EDA 및 전처리 (0) | 2022.01.27 |
자연어 처리 개요_자연어 생성과 기계 이해 (0) | 2022.01.09 |
자연어 처리 개요_텍스트 유사도 (0) | 2022.01.09 |
자연어 처리 개요_단어 표현 (0) | 2022.01.09 |
Comments