일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 구글 BERT의 정석
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- 군집화
- 오래간만에 글쓰네
- 결정계수
- word2vec
- numpy
- 모두의 딥러닝
- 기술통계학
- 감성분석
- 머신러닝
- 기초통계
- rnn
- 코사인 유사도
- 회귀분석
- 밑바닥부터 시작하는 딥러닝2
- Django
- 텍스트 분류
- F분포
- 은준아 화이팅
- Pandas
- student t분포
- 히스토그램
- 다층 퍼셉트론
- 최소자승법
- 가설검정
- 차원축소
- 자연어 처리
- 파이썬 pandas
- 밑바닥부터 시작하는 딥러닝
- Today
- Total
목록분류 전체보기 (149)
데이터 한 그릇
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dcl4TK/btrN5wQyRBs/26o55LHckeldtv90lcAcL1/img.png)
누락된 데이터(결측 데이터) 시계열의 빈도 변경(업샘플링, 다운샘플링) 데이터 평활 데이터의 계절적 변동 문제 해결 의도치 않은 사전관찰의 방지 누락된 데이터 다루기 시계열 데이터의 경우 비시계열 데이터보다 더 많은 결측값이 발생한다 따라서 시계열의 누락된 데이터를 다루기위한 다양한 방법이 제시됐다 대치법: 데이터셋 전체의 관측에 기반하여 누락된 데이터를 채워 넣는 방법 보간법: 대치법의 한 형태로 인접한 데이터를 사용하여 누락된 데이터를 추정하는 방법 영향받은 기간 삭제: 누락된 데이터의 기간을 완전히 사용하지 않는 방법 누락된 데이터에 대치법을 시험하기 위한 데이터셋 준비 대치법 사용법을 알아보기 위함임 미국 정부가 발표한 월간 실업 자료(https://data.bls.gov/timeseries/LN..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/dCNgQ1/btrNXtVb7WY/S3nrQEeiJU49Yet7lwgqik/img.png)
온라인 레포에서 시계열 데이터를 찾는 방법 시계열을 고려하지 않고 수집된 데이터에서 시계열 데이터를 발견하고 준비하는 방법 시계열 데이터를 다룰 때 나타나는 일반적인 난제, 특히 타임스팸프가 초래하는 어려움을 다루는 방법 시계열 데이터는 어디서 찾는가? 미리 준비된 데이터 셋 발견된 시계열 미리 준비된 데이터 셋 UCI 머신러닝 저장소 UEA 및 UCR 시계열 분류 저장소 정부 시계열 데이터셋 CompEngine R 패키지: Mcomp 와 M4comp2018 발견된 시계열 타임스탬프가 어디에나 존재할 수 있다는 관점에서 보면, 시계열이라고 명시되지 않은 구조화된 데이터에서 시계열 데이터를 찾는 것은 쉬운 일 ex) 회사의 하루 총 거래량, 여성 고객의 주당 지출 총액, 다변량 시계열 데이터도 생성도 가능..