데이터 한 그릇

기초통계 14 : 분산분석(2) 본문

통계/기초통계

기초통계 14 : 분산분석(2)

장사이언스 2021. 3. 24. 00:23
  • 일원분산분석
  • 다중비교검정
  • 이인자분산분석

https://kurt7191.tistory.com/19

 

기초통계13 : 분산분석(1)

일원분산분석 다중비교검정 분산분석 심험계획법 랜덤화블럭(이원) 분산분석 이인자분산분석 kurt7191.tistory.com/17 기초통계12 : 두 모집단 비교에 관한 추론 두 모평균 차이에 관한 추론 : 독립표

kurt7191.tistory.com


다중비교검정

 

    일원분산분석을 통해서 적어도 두 처리평균이 다르다는 것을 판별했다고 하자. 그렇다면 어떤 처리평균이 이와 같은 차이를 보이는지 알아내야 할 수도 있다. 체인음식점이 있다고 가정해보자. 필요에 의해서 어떤 점포가 평균적으로 더 많이 팔았고 어떤 점포가 평균적으로 덜 팔았는지 파악해야 할 수도 있다. 직관적으로 우리가 해야 할 일은 모집단으로부터 나타난 표본으로부터 각각 평균을 계산하고 가장 작은 평균과 가장 큰 평균을 비교하면 될 것처럼 보인다. 하지만 사실은 그렇지 않다. 이 일을 하기 위해서는 다른 통계 방법이 필요하다. 그 방법이 바로 다중비교검정(multiple comparisons)이다. 다중비교검정 역시 하나의 예제를 통해서 이해해 보도록 하자.

 


북미 자동차 회사들은 외국 자동차들로부터의 경쟁 때문에 자동차의 품질에 보다 더 관심을 가지게 되었다. 자동차 품질의 한 측면은 사고에 의해 발생된 손상의 수리비용이다. 한 자동차 회사는 다수의 새로운 자동차 범퍼들을 검토하고 있다. 새로운 자동차 범퍼들이 저속충돌에 얼마나 잘 반응하는지 테스트하기 위해 4개의 다른 유형의 자동차 범퍼 각각 10개 범퍼를 중형차에 설치하고 시속 5마일의 속도로 주행하여 벽에 부딪히게 하였다. 각 경우에 발생된 손상의 수리비용이 추정되었다.

 

a. 자동차 범퍼 유형 간에 저속충돌의 반응이 다르다고 5%의 유의수준에서 추론할 수 있는 충분한 증거가 존재하는가?

b. 만일 자동차 범퍼 유형 간에 저속충돌의 반응이 다르다면, 어느 자동차 범퍼 유형들이 다른가?

 


 

  먼저 문제를 해결하기 위해서는 일원분산분석을 해야만 한다. 계산해본 결과 검정통계량 F = 4.06이고 p-값은 0.0139가 나왔다. 따라서 범퍼들 간에 차이가 존재한다고 증명할 충분한 증거가 존재한다고 할 수 있다. 따라서 우리는 이제 어떤 범퍼가 차이를 보이는지 알아야 할 필요가 있다. 이 문제를 다루는 여러가지 추론 기법이 있다.

 

1)피셔의 최소유의차검정

 

  어느 모평균이 다른지 알기 위해서 모집단 평균들의 모든 쌍에 대하여 t검정을 수행한다. (ex, [1,2,3,4]의 모집단이 있다면 1:2,1:3,1:4...2:3,2:4...3:4 이렇게) 앞서 우리느 두 모집단의 모평균의 차이에 대한 검정에 대해서 배웠다. 두 모집단의 모평균의 차이는 두 모집단의 분산이 동일한지 동일하지 않은지에 따라서 검정 방법이 나뉜다. 두 모집단의 평균이 동분산이라는 전제 하에 t검정 수행을 진행한다. 본래 동분산일 때 두 모집단의 평균의 차이 검정은 분산의 값으로 통합분산추정치를 사용한다. 그러나 앞선 장에서 MSE는 검정하는 모집단들의 공통분산(common estimator)의 추정치임을 배웠다. mse는 통합분산추정치보다 더 좋은 통계 수치라고 할 수 있다. 따라서 동분산일 때의 두 모집단의 평균의 차이를 추정하는 t검정 공식에 통합분선추정치를 대신하여 MSE를 사용한다. 따라서 검정통계량을 구하는 식은 다음과 같다.

 

$$t = \frac{(\bar{x}_{i} - \bar{x}_{j}) - (\mu_{i} - \mu_{j})}{\sqrt{MSE(\frac{1}{n_{i}} + \frac{1}{n_{j}})}}$$ 

 

  신뢰구간에 대한 추정량 식은 다음과 같다. 이 경우의 자유도는 n-k와 같다.

 

$$(\bar{x}_{i} - \bar{x}_{j}) \pm t_{\frac{\alpha}{2}}\sqrt{MSE(\frac{1}{n_{i}} + \frac{1}{n_{j}})}$$

 

  최소유의차는(Least significant Difference : LSD)는 다음과 같이 정의된다.

 

$$LSD = t_{\frac{\alpha}{2}}\sqrt{MSE(\frac{1}{n_{i}} + \frac{1}{n_{j}})}$$

 

 

이렇게 일일이 모집단들의 평균의 차의 모든 쌍들을 t검정 할 수 있지만, 다른 편한 방법이 존재한다. 모평균들의 각 쌍 간에 차이가 존재하는지 결정하기 위한 간단한 한 가지 방법은 두 표본평균들 간 차이의 절댓값과 LSD를 비교하는 것이다. 만일 LSD가 두 표본평균들의 차이보다 작다면 다음과 같다. 

 

$$|\bar{x_{i} - \bar{x}_{j} > LSD}$$

 

  만일 LSD가 더 작다면 두 모평균이 다르다는 결론을 내린다(두 모집단의 각각의 표본들의 평균을 계산하고, 그 평균의 차이의 절댓값이 LSD보다 크다면 두 모집단의 평균은 다르다고 결론 짓는다.) 이 때 t의 자유도의 값에 주목해야만 한다. 본래 동분산일 때 두 모집단의 평균의 차이의 t검정의 자유도는 두 모집단의 표본크기 - 2였다. 그러나 LSD 통계량을 구할 때의 t검정은 n-k의 자유도를 사용한다. 이 때 n-k는 mse 값을 구할 때의 분모 값과 같다. (mse의 자유도라고 부르자, f통계량을 구할 때 f분포의 자유도로 사용하니까..)

 

  만일 모든 K개의 모집단의 표본크기가 동일하다면 LSD는 모평균들의 모든 쌍에 대하여 동일하다. 즉 각 모집단들의 표본의 크기가 전부 동일하다면, 모집단들의 모든 쌍의 LSD는 동일하다. 만일 표본크기가 다르면 LSD는 각각 계산되어야 한다. (식을 살펴보면 1/N이기 때문에 N이 모두 같다면 동일한 결과 값을 도출할 수 밖에 없다) 만일 모집단i와 j로부터 각각 표본을 뽑아 평균을 도출하고 그 값의 차이에 절대값을 씌운 값이 105.9 라고 하고, 유의수준 5%, 자유도 v인 lsd의 값이 104라고 한다면 i와 j의 평균은 차이가 있다는 유의미한 통계적 결론을 내릴 수 있다.

 

  하지만 피셔의 최소유의차 검정은 단점을 가지고 있다. 바로 검정이 여러번 일때의 실제 유의수준 값은 본래의 유의수준 값과 다르다는 것이다. 그렇다면 검정이 여러번일 때의 유의수준 값을 어떻게 구해질까? 먼저 1)k번 가설검정에서 제 1종 오류를 일으키지 않을 확률의 식은 다음과 같다.

 

$$(1-\alpha)^k$$

 

그렇다면 최소 1번이라도 제 1종 오류를 일으킬 확률은 아래의 식과 같다.

 

$$1-(1-\alpha)^k$$

 

  이 식을 이용해서 단 두 개의 모집단의 유의수준을 계산해본다고 하자. 유의수준이 5%라고 할 때 검정은 1번이다. 따라서 최소 1번이라도 제 1종 오류를 일으킬 확률은 다음과 같다.

 

$$1-(1-0.05)^1 = 0.05$$

 

  즉 검정이 한 번일 때는 유의수준에 변화가 없다. 따라서 유의수준 그대로의 값을 사용할 때는 두 모집단의 모수에 관한 비교에 한정해서 사용해야만 한다. 만일 모집단 3개의 평균의 비교를 검정한다고 해보자. 검정의 횟수는 다음의 식으로 구한다.

 

$$\frac{k(k-1)}{2}$$

 

  따라서 식을 이용하여 모집단 3개의 검정의 횟수를 구하면 3번의 검정이 이루어진다. 이를 이용하여 검정이 여러 번 일때의 유의수준을 구하면 다음과 같다.

 

$$1-(1-0.05)^3 = 0.142...$$

 

  따라서 본래의 유의수준 0.05에 비교하여 값이 달라지게 된다. 그렇다면 검정이 여러 번 일때는 유의수준에 관하여 조정을 해야만 하는데 이 때 사용하는 방식이 LSD 검정의 본페로니 조정이다.

 

2)LSD 검정의 본페로니 조정

 

  본페로니 조정의 방식은 다음과 같다. 본래의 유의수준을 비교횟수로 나누어주어 사용하는 것이다. 만일 K=6 일 때, 유의수준이 0.05라고 한다면 이 때의 유의수준을 6으로 나누는 것이다. 0.05를 6으로 나누게 된다면 값은 0.0033이 도출된다. 이제 앞의 예제를 살펴보도록 하자. 앞의 예제에서 각각의 모집단에서 임의표본을 추출하고 각각의 임의표본에서 평균을 도출했다고 가정해보자. 그리고 각 표본평균의 모든 쌍들의 차이를 구한다고 했을 때 그 값은 아래의 표와 같다.

 

$$|\bar{x}_{1} - \bar{x}_{2}| = |380.0 - 485.9| = 105.9$$
$$|\bar{x}_{1} - \bar{x}_{3}| = |380.0 - 483.8| = 103.8$$
$$|\bar{x}_{1} - \bar{x}_{4}| = |380.0 - 348.2| = 31.8$$
$$|\bar{x}_{2} - \bar{x}_{3}| = |485.9 - 483.8| = 2.1$$
$$|\bar{x}_{2} - \bar{x}_{4}| = |485.9 - 348.2| = 137.7$$
$$|\bar{x}_{3} - \bar{x}_{4}| = |483.8 - 348.2| = 135.6$$

 

  각각의 표본의 차이가 두 모집단의 평균이 차이가 있다고 주장할 수 있는지 검정하기 위해서는 검정통계량인 LSD를 구해야만 한다. 앞서 LSD를 구하는 공식은 MSE의 자유도를 따르는 t분포를 사용한다고 살펴봤다. 따라서 앞서 본페로니 조정을 통해서 도출된 유의수준을 이용하여 이 예제의 LSD값을 구하게 된다면 다음과 같다.

 

  본페로니 조정을 하지 않았을 때의 검정을 먼저 실행해 보겠다. 먼저 유의수준을 5%로 설정한다. 그리고 총 4개의 집단과 총 40의 표본크기를 가지고 있기 때문에 자유도는 n-k = 40-4 = 36이 도출이 된다. 이걸로 t값을 구하면 2.0303이다. 그리고 마지막으로 MSE의 값을 구하면 SSE/36인데 이 값을 계산해보면 12.399가 도출이 된다. 이 세 가지 통계수치를 이용하여 LSD 를 구하는 식은 다음과 같다.

 

$$t_{\frac{\alpha}{2}}\sqrt{MSE(\frac{1}{n_{i}} + \frac{1}{n_{j}})} = 2.030\sqrt{12.399(\frac{1}{10} + \frac{1}{10})} = 101.99$$

 

  만일 모든 표본의 표본크기가 동일하다면 모든 표본의 쌍의 LSD 또한 동일하다. 따라서 101.99를  위의 표에서 계산한 표본평균 차이의 절대값 값과 LSD값을 비교하여 LSD값이 더 작은지 작지 않은지 비교한다. 비교한 결과 총 4개의 모평균의 쌍이 서로 차이가 난다고 결정지을 수 있다. 바로 (1,2),(1,3),(2,4),(3,4) 이다.

 

  하지만 우리는 앞서 검정이 여러 번 시행이 될 경우 유의수준에 변화가 옴을 살펴보았다. 따라서 유의수준에 조정이 필요한데 본페로니 조정을 통해서 유의수준을 K개로 나누어 보겠다. 따라서 유의수준은 0.0083이 도출되었고 이를 통해서 t값을 도출한 결과 2.794가 나왔다. 이를 이용하여 lsd값을 구하여 최소유의차검정을 하게 되면 다음과 같은 식의 결과를 얻게 된다.

 

$$t_{\frac{\alpha}{2}}\sqrt{MSE(\frac{1}{n_{i}} + \frac{1}{n_{j}})} = 2.794\sqrt{12.399(\frac{1}{10} + \frac{1}{10})} = 139.13$$

 

  따라서 어떠한 모집단의 쌍도(평균) lsd와 비교했을 때 크지 않다. 따라서 어떠한 것도 차이가 없다고 결론을 내릴 수 있다.

 

 

 

 

 

 

Comments