데이터 한 그릇

넘파이를 이용한 기초통계 분석 본문

Python/넘파이(numpy)

넘파이를 이용한 기초통계 분석

장사이언스 2021. 6. 10. 21:03
  • numpy를 이용해서 기술통계학의 여러 기초통계 수치들을 구해보자.

 

총합, 평균, 편차

 

height = np.array([175,165,180,160])
weight = np.array([75,70,95,72])

 

임의의 데이터를 생성하자. (배열로)

 

1)총합

 

h_sum = np.sum(height)
w_sum = np.sum(weight)

 

2)평균

 

h_mean = np.mean(height)
w_mean = np.mean(weight)

 

3)편차

 

h_deviation = height - h_mean
w_deviation = weight = w_mean

 

분산, 표준편차

 

1)분산

 

h_var = np.var(height)
w_var = np.var(weight)

 

2)표준편차

 

h_std = np.std(height)
w_std = np.std(weight)

 

공분산, 상관계수

 

1)공분산

 

hw_cov1 = np.cov(height, weight, ddof=0)
hw_cov = hw_cov1[0,1]

 

ddof는 분산을 만들 때도 사용하는데 불편분산을 계산할지 or 표본분산을 계산할지 결정하는 매개변수다.

ddof = 0, 표본분산을 의미

np.cov 함수는 공분산 값을 리턴하는 게 아니라 공분산행렬을 반환한다.

1행 1열은 height 자기 자신의 공분산 즉, height 의 분산값을

2행 2열은 weight 자기 자신의 공분산 즉, weight의 분산값을 반환한다.

따라서 1행 2열 그리고 2행 1열만 두 변수의 공분산을 반환한다.

 

2)상관계수

 

hw_coef = np.corrcoef(height, weight)
hw_coef[0,1]

 

np.corrcoef 함수 역시 행렬을 반환한다. (2행 2열)

 

1행 1열과 2행 2열은 height와 weight 변수들의 스스로의 상관계수를 나타낸다.

1행 2열과 2행 1열만이 두 변수의 상관계수를 반환한다.

 

'Python > 넘파이(numpy)' 카테고리의 다른 글

넘파이)구조화된 배열  (0) 2021.06.08
넘파이)차원확대,차원교환  (0) 2021.06.08
넘파이 배열 나누고 합치기  (0) 2021.06.07
넘파이) 행렬 배치, 연산  (0) 2021.06.07
넘파이 시작하기 2  (0) 2021.06.02
Comments