넘파이를 이용한 기초통계 분석

Notice

Recent Posts

Tags more

Archives

관리 메뉴

데이터 한 그릇

Python/넘파이(numpy)

장사이언스 2021. 6. 10. 21:03

height = np.array([175,165,180,160])
weight = np.array([75,70,95,72])

임의의 데이터를 생성하자. (배열로)

1)총합

h_sum = np.sum(height)
w_sum = np.sum(weight)

2)평균

h_mean = np.mean(height)
w_mean = np.mean(weight)

3)편차

h_deviation = height - h_mean
w_deviation = weight = w_mean

1)분산

h_var = np.var(height)
w_var = np.var(weight)

2)표준편차

h_std = np.std(height)
w_std = np.std(weight)

1)공분산

hw_cov1 = np.cov(height, weight, ddof=0)
hw_cov = hw_cov1[0,1]

ddof는 분산을 만들 때도 사용하는데 불편분산을 계산할지 or 표본분산을 계산할지 결정하는 매개변수다.

ddof = 0, 표본분산을 의미

np.cov 함수는 공분산 값을 리턴하는 게 아니라 공분산행렬을 반환한다.

1행 1열은 height 자기 자신의 공분산 즉, height 의 분산값을

2행 2열은 weight 자기 자신의 공분산 즉, weight의 분산값을 반환한다.

따라서 1행 2열 그리고 2행 1열만 두 변수의 공분산을 반환한다.

2)상관계수

hw_coef = np.corrcoef(height, weight)
hw_coef[0,1]

np.corrcoef 함수 역시 행렬을 반환한다. (2행 2열)

1행 1열과 2행 2열은 height와 weight 변수들의 스스로의 상관계수를 나타낸다.

1행 2열과 2행 1열만이 두 변수의 상관계수를 반환한다.

'Python/넘파이(numpy)' Related Articles

Comments