일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- student t분포
- 구글 BERT의 정석
- 자연어 처리
- 기초통계
- 머신러닝
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- Pandas
- word2vec
- 오래간만에 글쓰네
- 밑바닥부터 시작하는 딥러닝
- 차원축소
- rnn
- 군집화
- 최소자승법
- 회귀분석
- 코사인 유사도
- 결정계수
- F분포
- 감성분석
- Django
- 텍스트 분류
- 파이썬 pandas
- numpy
- 기술통계학
- 가설검정
- 히스토그램
- 밑바닥부터 시작하는 딥러닝2
- 모두의 딥러닝
- 은준아 화이팅
- 다층 퍼셉트론
- Today
- Total
목록머신러닝 (2)
데이터 한 그릇
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/ccvcvZ/btq5MoCRpKp/QwuwkDkQa17sGjDLi3rC7k/img.png)
평균 이동(Mean Shift)의 개요 군집화 머신러닝 중에 하나인 k-means은 임의의 군집 중심점을 잡은 이후에 그 주변의 데이터의 평균 거리로 이동을 하면서 군집화를 진행한다. 평균 이동 알고리즘도 이와 비슷하다. 단, 평균 데이터의 거리로 이동하던 k-means에 반해서, 평균 이동은 데이터의 밀도를 기준으로 삼아서 군집 중심점이 이동한다. 그렇다면 어떤 방식으로 밀도가 가장 높은 곳으로 군집 중심점이 이동할까? 평균 이동 군집화는 데이터의 분포도를 이용해서 군집 중심점을 찾는다. 이를 위해서 확률 밀도 함수를 이용한다. 죽, 확률 밀도 함수가 가장 피크인 지점을 군집 중심점으로 이동한다. 그리고 일반적으로 주어진 모델의 확률 밀도 함수를 찾기 위해서 KDE(Kernal Density Estim..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/byFj6S/btq5LW5AiNF/MUJU4lkAYhvmDzwbwEPFZK/img.png)
DBSCAN 개요 DBSCAN 적용하기 DBSCAN 개요 만일 데이터 셋이 복잡한 기하학적 분포를 가지고 있다면 앞서 살펴봤던 K-MEAN, GMM으로는 효과적인 군집화를 하기 어렵다. DBSCAN 같은 경우에는 복잡한 기하학적 분포를 가지고 있는 데이터를 군집화할 때 효과적으로 군집화를 수행할 수 있다. DBSCAN을 구성하는 가장 중요한 두 가지 파라미터는 입실론(epsilon)으로 표기하는 주변 영역과 이 입실론 주변 영역에 포함되는 최소 데이터 개수이다. (입실론 영역, 영역 내 최소 데이터 개수) 데이터 세트 내의 데이터 포인트에 대해서 입실론 내 최소 데이터의 개수에 따라 다르게 정의내린다. 핵심 포인트(core point) : 입신론 주변 영역 내에 최소 데이터 개수 이상의 데이터를 가지고 ..