카테고리 없음

5주차 TIL - 통계의 마지막 에피소드

게임취업하고싶은 사람 2025. 1. 21. 20:55

1. t-검정(t-test)

목적:

두 집단 간의 평균 차이를 비교하기 위해 사용됩니다.

종류:

  1. 독립 표본 t-검정 (Independent t-test)
    • 서로 독립적인 두 집단의 평균을 비교.
    • 예: 남성과 여성의 키 차이를 비교.
  2. 대응 표본 t-검정 (Paired t-test)
    • 동일한 집단에서 두 번 측정한 값을 비교.
    • 예: 다이어트 전후의 체중 변화.

가정:

  • 데이터가 정규분포를 따른다.
  • 두 집단의 분산이 동일해야 한다(등분산 가정).
    (등분산 가정이 충족되지 않으면 Welch의 t-검정을 사용함.)

단점:

  • 비교할 수 있는 집단이 두 개로 제한됩니다.

2. ANOVA (Analysis of Variance, 분산분석)

목적:

세 개 이상의 집단 간 평균 차이를 비교하기 위해 사용됩니다.

종류:

  1. 일원분산분석 (One-way ANOVA)
    • 하나의 독립변수(요인)가 여러 집단으로 나뉘어 있을 때 평균 차이를 비교.
    • 예: 세 개의 다른 약물을 복용한 환자들의 평균 혈압 비교.
  2. 이원분산분석 (Two-way ANOVA)
    • 두 개의 독립변수가 있을 때 각 요인과 요인 간 상호작용이 종속변수에 미치는 영향을 분석.
    • 예: 약물의 종류와 운동 여부가 혈압에 미치는 효과.

가정:

  • 데이터가 정규분포를 따른다.
  • 각 집단의 분산이 동일해야 한다(등분산 가정).
  • 독립변수 간 상호작용이 없을 경우가 더 단순한 분석.

장점:

  • 세 개 이상의 집단을 동시에 비교할 수 있음.
  • 다양한 요인 간의 상호작용도 분석 가능(이원분산분석 이상에서).

단점:

  • 집단 간 차이가 있음을 확인하지만, 어디에서 차이가 나는지는 알 수 없음.
    (차이가 있는 집단을 확인하려면 **사후검정(Post-hoc test)**이 필요함. 예: Tukey’s HSD)

차이점 비교

특징 (t-검정,ANOVA)

비교 가능한 집단 수 2개 3개 이상
독립변수의 수 1개 1개 또는 2개 이상
결과 해석 두 집단 간 평균 차이가 있는지 확인 여러 집단 간 평균 차이가 있는지 확인
추가 분석 필요성 추가 분석 필요 없음 사후검정 필요(Tukey, Scheffé 등)
복잡성 상대적으로 간단 상대적으로 복잡

예제

  1. t-검정 예제
    • 남학생과 여학생의 수학 점수 평균이 다른지 비교.
  2. ANOVA 예제
    • 세 개의 교육 방법(A, B, C)에 따른 학생들의 평균 시험 점수가 다른지 비교.

결론

  • 비교할 집단이 2개라면 t-검정, 3개 이상이라면 ANOVA를 사용합니다.
  • ANOVA는 보다 많은 변수를 다룰 수 있어 더 복잡한 연구에 적합합니다.