Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- 기초통계
- Pandas
- 최소자승법
- 기술통계학
- 가설검정
- 머신러닝
- 밑바닥부터 시작하는 딥러닝2
- 감성분석
- 결정계수
- 자연어 처리
- 다층 퍼셉트론
- 군집화
- word2vec
- 텍스트 분류
- student t분포
- 파이썬 pandas
- 은준아 화이팅
- Django
- 밑바닥부터 시작하는 딥러닝
- F분포
- 오래간만에 글쓰네
- 히스토그램
- 차원축소
- 구글 BERT의 정석
- 텐서플로2와 머신러닝으로 시작하는 자연어처리
- rnn
- numpy
- 모두의 딥러닝
- 코사인 유사도
- 회귀분석
Archives
- Today
- Total
데이터 한 그릇
넘파이를 이용한 기초통계 분석 본문
- numpy를 이용해서 기술통계학의 여러 기초통계 수치들을 구해보자.
총합, 평균, 편차
height = np.array([175,165,180,160])
weight = np.array([75,70,95,72])
임의의 데이터를 생성하자. (배열로)
1)총합
h_sum = np.sum(height)
w_sum = np.sum(weight)
2)평균
h_mean = np.mean(height)
w_mean = np.mean(weight)
3)편차
h_deviation = height - h_mean
w_deviation = weight = w_mean
분산, 표준편차
1)분산
h_var = np.var(height)
w_var = np.var(weight)
2)표준편차
h_std = np.std(height)
w_std = np.std(weight)
공분산, 상관계수
1)공분산
hw_cov1 = np.cov(height, weight, ddof=0)
hw_cov = hw_cov1[0,1]
ddof는 분산을 만들 때도 사용하는데 불편분산을 계산할지 or 표본분산을 계산할지 결정하는 매개변수다.
ddof = 0, 표본분산을 의미
np.cov 함수는 공분산 값을 리턴하는 게 아니라 공분산행렬을 반환한다.
1행 1열은 height 자기 자신의 공분산 즉, height 의 분산값을
2행 2열은 weight 자기 자신의 공분산 즉, weight의 분산값을 반환한다.
따라서 1행 2열 그리고 2행 1열만 두 변수의 공분산을 반환한다.
2)상관계수
hw_coef = np.corrcoef(height, weight)
hw_coef[0,1]
np.corrcoef 함수 역시 행렬을 반환한다. (2행 2열)
1행 1열과 2행 2열은 height와 weight 변수들의 스스로의 상관계수를 나타낸다.
1행 2열과 2행 1열만이 두 변수의 상관계수를 반환한다.
'Python > 넘파이(numpy)' 카테고리의 다른 글
넘파이)구조화된 배열 (0) | 2021.06.08 |
---|---|
넘파이)차원확대,차원교환 (0) | 2021.06.08 |
넘파이 배열 나누고 합치기 (0) | 2021.06.07 |
넘파이) 행렬 배치, 연산 (0) | 2021.06.07 |
넘파이 시작하기 2 (0) | 2021.06.02 |
Comments