728x90

STUDY/통계 8

3그룹(또는 그 이상)의 평균값이 차이가 있을까? - 엑셀로 분산분석(ANOVA)하는 방법

ANOVA 앞전에 올린 T-Test와 비슷한 ANOVA 분석을 알아봅시다! T-Test는 한가지의 요인에 대해 2개의 그룹을 비교하는 방법이였다고 하면, ANOVA는 한가지의 요인에 대해 3개 이상의 그룹을 비교하는 방법이예요. 1. 예제 경제학, 의학, 역사 학위를 갖고 있는 사람들의 급여이다. 이 3그룹의 평균은 같다고 할 수 있을까? H0: μ1 = μ2 = μ3 (세 그룹의 평균은 같다고 할 수 있다.) H1: 하나의 그룹이라도 평균이 다르다고 할 수 있다. 2. 엑셀로 ANOVA 분석하기 (1) 데이터탭 -> 데이터분석 -> 분산 분석 : 일원 배치법 (2) 입력범위 : 값 범위 / 유의 수준 : 0.05 (3) 결과값 해석하기 1) 요약표에서 보면 한눈에 합계/ 평균/ 분산을 확인할 수 있으며..

STUDY/통계 2020.11.25

개선 전과 후의 평균값이 차이가 있을까? - 엑셀로 T-Test(T 검정)하는 방법

T-Test 업무를 하다보면 빈번하게 개선 진행이 이루어지며, 그 결과값이 개선전과 비교하여 개선이 되었는지를 확인하는 척도로 T-Test를 진행을 해요. T-Test는 2개의 집단에 대한 비교만 가능하며, 그 이상의 집단일 경우 ANOVA를 사용해요. 일반적으로 미니탭을 많이 활용하나 요즘은 엑셀에도 통계 분석 기능이 적용이 되어 있어서 간편하게 분석해볼 수 있어요. T-Test는 두 모집단의 평균이 같다는 귀무가설을 검정하게 되어 있어요. (귀무가설 H0을 기각하면 개선 전에 비해 개선 후의 평균값이 달라졌다고 할 수 있으며, H0가 채택되었을 경우에는 개선 전과 후의 평균 차이는 없다고 볼 수 있다.) H0: μ1 - μ2 = 0 - 귀무가설 H1: μ1 - μ2 ≠ 0 - 대립가설 1) 예제 아래..

STUDY/통계 2020.11.23

변수끼리 얼마나 연관성이 있을까? - 엑셀로 상관관계분석하기

상관관계분석 업무를 하다보면 수많은 데이터를 축적하고 있는데, 그 데이터의 변수들끼리 관계가 있는지를 알아보고 싶을때 상관관계 분석을 사용합니다. 결과값으로 상관계수를 추출하게되는데 -1과 +1사이의 값이며 변수들이 얼마나 밀접하게 관련되어 있는지를 알수있는 척도가 됩니다. 상관 계수 +1은 완전한 양의 상관관계를 뜻하며, -1은 완전한 음의 상관관계를 뜻합니다. 1. 엑셀로 상관관계 분석하기 (1) 엑셀 함수를 이용하여 2개의 변수를 분석하기 예제로 하기와 같이 X,Y 2개의 변수 데이터값이 있으며, Y=X+2로 임의의 값을 넣어보았습니다. 더보기 =CORREL("X값 범위","Y값 범위") 결과값 : 1 해석 : 두 변수의 값은 완전한 양의 상관관계를 갖는다. 즉, 두 변수는 서로에게 영향을 줄 수 ..

STUDY/통계 2020.11.17

런차트(Run chart)의 이해_ Minitab 미니탭

1. 런챠트(Run Chart)의 사용 목적 모든 공정에서는 동일한 패턴, 이동, 추세에 따라 변화가 일어나는 것은 자연스러운 부분입니다. 공정 관리에서는 항상 언급되는 바와 같이 이상원인을 제거해야되며, Run Chart 또한 현 시스템의 외부 영향으로 인한 이상 변동을 그래프로 보여주는 공정관리 Tool입니다. Run Chart를 해석하고 그에 따른 이상변동에 대한 원인을 분석하여 제거하므로써 공정을 관리할 수 있습니다. 2. 미니탭으로 런챠트(Run Chart) 그리기 * 예제 : 사출공정에서 제품 중량을 Shift별 5개의 Sample을 수집하고, 총 10Shift의 Data를 취출하여 Run Chart를 분석. (Spec : 20g +- 0.1g) 1) Data 삽입하기 - C1에는 Subgro..

STUDY/통계 2020.03.29

확률과 분포

정량적 데이터 1) 계량치 : 정규분포, t분포, 카이제곱분포, F분포, 지수분포 - 길이, 무게, 강도, 온도 등 2) 계수치 : 초기하분포, 이항분포, 푸아송분포 - 부적합품수, 사고건수, 홈의 수 등 모집단 (개수 ; N) : 원집단이며 모수라고 칭함. 1) 모평균 : 모집단의 평균을 뜻함 2) 모분산 : 모집단의 산포 (흩어짐)을 뜻함 3) 모표준편차 : 모집단의 산포 (흩어짐)을 뜻함. 모분산의 루트값 통계량 (시료) : 모집단인 로트에서 데이터를 Sampling하여 만들어지는 집단 1) 중심적 경향 : 산술평균, 중앙치, 범위중앙치, 최빈수, 조화평균, 기하평균 2) 산포(흩어짐) : 제곱합, 분산, 표준편차, 범위, 변동계수, 상대분산 3) 분포의 모양 : 비대칭도, 첨도 도수분포표 -> 어..

STUDY/통계 2019.11.25

2요인실험 - ANOVA

1. 2개의 요인 중 어느 인자가 영향을 미치는지를 통계적으로 결정해보자. 결과값에 대해 p-value를 확인하여 귀무가설에 대한 기각 또는 채택하여 2 인자 중 주인자를 판단한다. 보통 유의수준 (α or alpha)는 0.05를 사용하며, 이는 결과값에 대한 5% Risk를 뜻한다. 만약 p-value가 유의수준보다 크다면, 귀무가설을 기각한다. 만약 P-value가 유의수준보다 작거나 같다면, 귀무가설을 채택한다. 2. Data 입력 및 결과값 도출하기 예시) 금속 처리액의 농도와 3사의 원재료에 대한 강도 확인. (3회 반복 실험) 인자A = 금속 처리시 사용하는 처리액의 농도 3.0% , 3.5%, 4.0% 인자B = A사 원재료, B사 원재료, C사 원재료 구분 3.0% 3.5% 4.0% A ..

STUDY/통계 2019.11.21

P-Value_유의확률의 이해

P-Value의 의미 P-Value는 유의 확률로 불리며, 귀무가설이 맞다는 전제 하에 Sample의 Data가 귀무가설 하의 값이 얼마나 관찰될지에 대한 확률 값을 뜻합니다. 유의 수준을 기준으로 P-Value가 유의수준보다 높다면 귀무가설을 채택하고, 낮으면 대립가설을 채택하게 됩니다. 유의수준 0.05 P-Value >= 0.05 : 귀무가설 채택 P-Value < 0.05 : 대립가설 채택 예시1. 가나 사에서 판매하는 피넛 초콜릿에 대해 최근 고객으로 부터 피넛 함유량 미달 컴플레인이 접수되었다. 가나 피넛 초콜릿은 개당 200g이며, 70g의 피넛이 함유된다. 가나 사는 모든 피넛 초콜릿을 조사해볼수 없기에 보유하고 있는 400개 재고에서 20개를 Sampling 검사하기로 정하였다. H0(귀..

STUDY/통계 2019.11.13

DOE(실험계획법) - 1요인 실험_ 결과 데이터 분석하기

1. 적용 범위 특정한 1인자만의 영향을 조사하고자 할 때 사용한다. 예) 모 타이어 제조회사에서 신제품인 Radial Tire 개발에 있어서, 타이어 제조 과정중에 생타이어 원주길이가 타이어 제품의 균형에 어떤 영향을 미치는가를 알고 싶어 실험계획을 실시한다. (A1=3,260mm / A2=3,265mm/ A3=3,270mm) 2. 목적 1) Screening : 중요한 요인을 발견하고 특성을 알아낸다. a. 완전요인 배치 계획_Full Factorial Design b. 2k 배치 계획 (2k Factirual Design) c. 일부 실시법 (Fractional Factorial Design) 2) Optimizing : 최적의 조건을 찾는다. a. 반응표면 분석법 (Respons Surface M..

STUDY/통계 2019.11.13
728x90