일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- 차원축소
- 밑바닥부터 시작하는 딥러닝2
- 감성분석
- 모두의 딥러닝
- 기초통계
- 최소자승법
- student t분포
- 가설검정
- 은준아 화이팅
- 히스토그램
- numpy
- 결정계수
- 다층 퍼셉트론
- Django
- word2vec
- 기술통계학
- 구글 BERT의 정석
- 머신러닝
- 밑바닥부터 시작하는 딥러닝
- rnn
- Pandas
- 코사인 유사도
- 회귀분석
- 군집화
- 파이썬 pandas
- F분포
- 텍스트 분류
- 자연어 처리
- 오래간만에 글쓰네
- Today
- Total
목록자연어 처리 (4)
데이터 한 그릇
자연어 처리 개요_텍스트 분류(Text Classification) 자연어 처리 기술을 통해, 특정 텍스트를 사람들이 지정한 몇 가지 범주(class) 중에 어디 속하는지 분류하는 문제. 이 텍스트는 어떤 범주에 들어갈까? 텍스트 분류 문제는 class 가 두 개인 이진 분류 문제일수도 있고 class 가 여러 개인 다중 분류 문제일수도 있다. 텍스트 분류의 예시 스팸 분류 이진분류 문제. 이 메일이 스팸이냐 스팸이 아니냐? 감정 분류 이 글이 긍정적인 글이냐 부정적인 글이냐? 경우에 따라는 이진 분류 문제가 아니라 다중 분류 문제일수도 있다. ''중립'' 을 추가해서. 뉴스 기사 분류 이 글이 어떤 주제에 속하는가? (스포츠, 연예, 정치, 경제 등등) 그렇다면 텍스트 분류 문제는 어떻게 해결할 수 있..
자연어 처리 개요_텍스트 유사도 "이 노래 누가 만들었어?" "지금 나오는 노래 작곡가가 누구야?" 우리는 이 두 개의 문장이 같은 의미를 지니고 있는지 금방 파악할 수 있지만, 기계는 그러지 못한다. 따라서 두 문장에 대해 답변을 하려면 각각의 답변을 준비해야만 한다. 하지만 이 텍스들간에 유사성이 있음을 판단하면 한 개의 답변만 준비하면 된다. 이 두 텍스트가 유사한지 유사하지 않은지 측정하면 되는데, 이때 사용하는 방법이 텍스트 유사도(TextSimilarity) 다. 텍스트 유사도 방식에는 여러 가지 방식이 있는데, 그 중에서 ***딥러닝을 기반으로 텍스트의 유사도를 측정하는 방식을 주로 다룰 예정.*** ***텍스트를 벡터화 한 이후에, 벡터화 된 각 문장간의 유사도를 측정하는 방법.*** (t..