일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 가설검정
- 은준아 화이팅
- 다층 퍼셉트론
- 결정계수
- 기술통계학
- 자연어 처리
- 텍스트 분류
- 밑바닥부터 시작하는 딥러닝
- 파이썬 pandas
- 구글 BERT의 정석
- 최소자승법
- 모두의 딥러닝
- 코사인 유사도
- numpy
- 밑바닥부터 시작하는 딥러닝2
- 감성분석
- F분포
- rnn
- 차원축소
- Pandas
- 히스토그램
- 기초통계
- 회귀분석
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- 오래간만에 글쓰네
- word2vec
- 머신러닝
- student t분포
- 군집화
- Django
- Today
- Total
목록분류 전체보기 (149)
데이터 한 그릇
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/UIPUN/btrOtFUMyJl/J4UkFzUIPCvbKLPpR7mDIk/img.png)
1. 자체상관의 파악과 이해 시계열의 자체상관의 개념은 특정 시점의 값이 다른 시점의 값과 상관관계가 있다는 것 ("자체상관"은 공식적인 언어 X) 아주 raw 하게 예시를 들어보면, 일일 온도를 측정한 데이터를 가정했을 때, 5월 15일의 온도가 높아질 때 8월 15일의 온도도 높아짐을 발견하여 두 날짜간의 상관관계가 존재함을 밝혀낼 수 있다(반대도 가능) 반면에 상관관계가 0에 가깝다는 사실을 알게 된다. 즉, 5월 15일의 온도 정보만으로는 8월 15일의 온도 범위의 어떤 정보도 알 수 없다 (여기까지가 자체상관을 raw 하게 간략하게 설명한 것) 위의 자체상관 개념을 자기상관(autocorrelation)으로 확장할 수 있다. 특정 시점에 고정되지 않는 자기상관은 자체상관을 일반화한 것, 특히 고..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/FFRKT/btrOoA0dXdl/B5mOBA4pawkCuA17ka6GsK/img.png)
이번 장에서는 시계열을 위한 탐색적 자료 분석 논의를 두 부분으로 나누어 설명한다 시계열에 사용되는 데이터 응용 기법 (히스토그램, 도표 그리기, 그룹화 연산) 시계열 분석의 근본적인 시간 기법 강조 (이 기법은 시계열 데이터를 위해 특별히 개발되었으며, 데이터가 서로 시간 관계가 있는 상황에서만 의미가 있음) 1. 친숙한 방법 비시계열 데이터에 적용하는 방법과 동일한 탐색적 자료 분석 방법 쓸 수 있는 열, 각 열이 가지는 값의 범위, 가장 알맞은 측정 단위와 같은 것을 알고 싶을 것 또한 다음 아래와 같은 질문에 대한 답을 얻고 싶을 것 긴밀한 상관관계를 가지는 열이 있는가? 관심 대상 변수의 전체 평균과 분산은 무엇인가? 분석값의 범위는 무엇인가? 다른 논리적 단위나 기간에 따라 값이 달라지는가? ..