STUDY/통계

P-Value_유의확률의 이해

UberSleep 2019. 11. 13. 21:57
728x90

 

p value 유의확률의 이해

 

P-Value의 의미

 

  • P-Value는 유의 확률로 불리며, 귀무가설이 맞다는 전제 하에 Sample의 Data가 귀무가설 하의 값이 얼마나 관찰될지에 대한 확률 값을 뜻합니다. 유의 수준을 기준으로 P-Value가 유의수준보다 높다면 귀무가설을 채택하고, 낮으면 대립가설을 채택하게 됩니다.
  1. 유의수준 0.05
  2. P-Value >= 0.05 : 귀무가설 채택
  3. P-Value < 0.05 : 대립가설 채택

 

예시1.

  • 가나 사에서 판매하는 피넛 초콜릿에 대해 최근 고객으로 부터 피넛 함유량 미달 컴플레인이 접수되었다. 가나 피넛 초콜릿은 개당 200g이며, 70g의 피넛이 함유된다. 가나 사는 모든 피넛 초콜릿을 조사해볼수 없기에 보유하고 있는 400개 재고에서 20개를 Sampling 검사하기로 정하였다.
  1. H0(귀무가설) : 피넛 함유량의 평균 >= 70g
  2. H1(대립가설) : 피넛 함유량의 평균 < 70g
  3. 유의수준 : a = 0.05
  • 만약 20개의 Sample Data 평균 값이 30g이라면 이 값은 명백히 대립가설을 채택할 것이며, 95g이라면 명백히 귀무가설을 따를 것이다. 하지만 Data가 아래와 같이 나왔다면? 

       55 70 55 68 64 67 57 68 65 85 69 85 67 72 72 75 65 69 62 76 79 72 69 73 72 73 62 71 70 60

       -> 평균 : 68.9

 

  • 68.9이 나왔기 때문에 피넛 함유량이 70g 미만이라고 할 충분한 증거가 될 것인가? 아니면 단순히 운일까?
  • 이 값을 검증하는 단계에서 P-Value 의미는 하기와 같다.
  • Data의 P-Value는 0.18이다. 즉 이 의미는 처음 설명에서와 같이 귀무가설(피넛 함유량은 70g 이상이다)이 맞다고 가정하며, 같은 Sample 수량을 취출했을 시 그 값이 68.9 미만이 될 확률이 18%이라는 의미이다.
728x90