카테고리 없음

6주차 TIL - 범주형 데이터 복습

게임취업하고싶은 사람 2025. 1. 23. 20:51

1. t-검정 (t-test)

  • 목적: 두 집단 간의 평균 차이가 통계적으로 유의미한지 검정.
  • 사용 상황:
    • 집단 수가 2개일 때 사용.
    • 종속 변수가 연속형 데이터일 때.
    • 독립 변수는 **범주형(2개의 그룹)**일 때.
    • 두 그룹의 샘플 크기나 분산이 유사하다고 가정.
  • 예시:
    1. 독립표본 t-검정:
      • 질문: 남성과 여성의 평균 키에 차이가 있는가?
      • 데이터:성별키 (cm)
        남성 175
        여성 162
    2. 대응표본 t-검정:
      • 질문: 다이어트 전후 체중 변화가 유의미한가?
      • 데이터:참가자다이어트 전 체중(kg)다이어트 후 체중(kg)
        A 70 65

2. ANOVA 검정 (분산분석)

  • 목적: 세 개 이상의 집단 간 평균 차이가 통계적으로 유의미한지 검정.
  • 사용 상황:
    • 집단 수가 3개 이상일 때 사용.
    • 종속 변수가 연속형 데이터일 때.
    • 독립 변수는 **범주형(3개 이상의 그룹)**일 때.
  • 예시:
    • 질문: 세 개의 학습 방법(A, B, C)에 따라 시험 성적에 차이가 있는가?
    • 데이터:학습 방법시험 점수
      A 85
      B 90
      C 75

t-검정과 ANOVA 검정 비교

특징t-검정ANOVA 검정

집단 수 2개 집단 3개 이상의 집단
목적 두 집단 평균 차이 검정 여러 집단 간 평균 차이 검정
데이터 유형 독립변수: 범주형(2개 그룹), 종속변수: 연속형 독립변수: 범주형(3개 이상 그룹), 종속변수: 연속형
결과 해석 p-값을 통해 두 집단 간 평균 차이 유의성 판단 p-값을 통해 전체 집단 간 평균 차이 유의성 판단
한계 두 집단 간 비교만 가능 어떤 집단 간 차이가 유의미한지는 추가 검정 필요

3. t-검정과 ANOVA 검정이 필요한 상황 비교

t-검정 필요 상황:

  • 남성과 여성의 평균 수면 시간이 차이가 있는지 분석.
  • 비타민을 복용한 그룹과 복용하지 않은 그룹의 평균 체력 차이 분석.

ANOVA 검정 필요 상황:

  • 세 개의 운동 프로그램(A, B, C)이 체중 감소에 미치는 영향을 비교.
  • 세 지역(서울, 부산, 대구) 간 평균 연소득 차이 분석.

요약

  • t-검정은 두 그룹 간 평균 차이를 검정할 때 사용.
  • ANOVA 검정은 세 개 이상의 그룹 간 평균 차이를 검정할 때 사용.