통계적 가설 검정 완벽 정리 (귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향)_ADsP 3과목

🧪✨ 통계적 가설 검정 완벽 정리 💡

귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향


🎯 1️⃣ 가설 검정이란?

📊 “데이터를 통해 모집단에 대한 주장(H₀) 이 맞는지 검정하는 과정!”

💬 쉽게 말하면,

👉 “데이터로 가설이 맞는지 따져보는 절차”예요.


🏳️‍🌈 2️⃣ 귀무가설 (H₀ : Null Hypothesis)

차이 없음, 변화 없음, 효과 없음”이라는 기본 주장이에요.

📘 예시

  • 💊 신약의 효과가 기존 약과 같다.
  • 👩‍🏫 남녀 평균 점수는 같다.
  • 💻 A/B 버전 전환율에 차이가 없다.

💡 핵심: 귀무가설은 “지금 상태 유지”의 주장!


🏴‍☠️ 3️⃣ 대립가설 (H₁ or Hₐ : Alternative)

“귀무가설이 틀렸을 때 참이 되는 주장” ⚡

📘 예시

  • 💊 신약이 기존 약보다 효과가 다르다.
  • 👩‍🏫 남녀 평균 점수가 다르다.
  • 💻 A/B 전환율이 다르다.

💡 즉, 검정의 목표는 H₀를 기각하고 H₁를 지지하는 것!


📉 4️⃣ 유의확률 (p-value)

🎯 “H₀가 참이라고 가정했을 때, 관찰된 결과만큼 극단적인 결과가 나올 확률!”

📘 해석

  • p-value가 작을수록 → H₀ 하에서 보기 힘든 결과 → H₀ 기각 가능성 높음

💡 결정 기준

✅ p ≤ α → H₀ 기각 (유의함)

❌ p > α → H₀ 기각 못 함 (유의하지 않음)

📊 예시

p = 0.02 → 2%의 확률밖에 없으니 H₀ 기각!


📏 5️⃣ 검정 통계량 (Test Statistic)

데이터에서 계산한 증거의 크기 📐

상황검정 통계량사용하는 분포
평균 비교tt분포
비율 비교z정규분포
분산 비교FF분포
적합도 / 독립성χ²카이제곱분포

💬 검정통계량이 크면 → H₀로부터 멀다 → 기각 가능성↑


🔒 6️⃣ 유의수준 (α : Significance Level)

💬 “H₀를 기각할 기준선”

📏 보통 0.05 (5%), 때로는 0.01(1%) 사용

📘 의미

  • α = 0.05 → “귀무가설이 참인데도 5% 확률로 잘못 기각할 수 있다.”
  • 💡 즉, 1종 오류 허용 한계!

⚠️ 7️⃣ 오류의 두 가지 😱

구분실제상황판단의미예시
🚨 1종 오류(α)H₀ 참H₀ 기각“맞는 걸 틀렸다고 함”무고한 사람 처벌 ⚖️
💤 2종 오류(β)H₀ 거짓H₀ 유지“틀린 걸 놓침”진짜 범인 놓침 🔍

💡 검정력(Power) = 1 – β

→ 실제로 차이가 있을 때 잘 잡아내는 능력 💪

→ 표본 수 ↑, 효과 크기 ↑, 분산 ↓ → Power ↑


🧭 8️⃣ 양측검정 vs 단측검정

구분의미대립가설방향그림
⚖️ 양측검정“다르다”H₁: μ ≠ μ₀양쪽 꼬리⬅️➡️
👉 우측검정“크다”H₁: μ > μ₀오른쪽➡️
👈 좌측검정“작다”H₁: μ < μ₀왼쪽⬅️

💬 예시

  • “A제품이 B보다 크다” → 우측검정
  • “A제품이 B와 다르다” → 양측검정

⚠️ 주의: 방향은 “사전에” 정해야 해요! (데이터 본 뒤 변경 ❌)


🧮 9️⃣ 가설 검정 5단계 절차 ✏️

단계내용예시
가설 설정H₀: μ=3, H₁: μ≠3
유의수준 설정α=0.05
검정통계량 계산t, z, F 등
p-value 계산p와 α 비교
결과 해석“H₀ 기각 / 유지” 결론 도출

📊 10️⃣ 예시 — 1표본 t검정 ✨

상황:

고객 만족도 평균이 3.0인지 확인!

표본: n=36, 𝑥̄=3.25, s=0.6, α=0.05

H₀: μ = 3.0 H₁: μ ≠ 3.0 (양측)

계산

t = (3.25 – 3.0) / (0.6 / √36) = 0.25 / 0.1 = 2.5

판단

p ≈ 0.017 < 0.05 → ✅ H₀ 기각

💬 결론:

“만족도 평균은 3.0보다 유의하게 다르다(상승했다).”


🧾 11️⃣ 검정 선택 가이드 💡

검정 목적데이터 형태검정 종류
평균 = μ₀연속형1표본 t
평균 비교(두 집단)연속형독립 2표본 t
비율 = p₀범주형1표본 z
두 비율 비교범주형2표본 z
3집단 이상 평균연속형ANOVA(F)
분산 비교연속형F검정
범주형 적합도범주형χ²검정

📘 12️⃣ 공식 🧮

평균 t검정

t = (x̄ – μ₀) / (s / √n)

df = n – 1

기각기준: |t| ≥ t*(α/2, df) ⇔ p ≤ α

비율 z검정

z = (p̂ – p₀) / √(p₀(1-p₀)/n)

기각기준: |z| ≥ z*(α/2) ⇔ p ≤ α

오류와 검정력

1종 오류 = α

2종 오류 = β

검정력(Power) = 1 – β


💎 13️⃣ 핵심 요약 💬

가설검정 핵심 문장

“데이터로 H₀(기존 주장)을 의심하고,

p-value와 α를 비교해 통계적으로 유의한가 판단한다!”

📊 기억 공식

  • p < 0.05 → ✅ “유의하다! (H₀ 기각)”
  • p > 0.05 → ❌ “유의하지 않다 (H₀ 유지)”

✅ ADsP 시험 핵심 체크리스트 🔥

✔️ 귀무가설 vs 대립가설 의미

✔️ p-value와 α 비교 규칙

✔️ 1·2종 오류 구분

✔️ 양측/단측 판단 기준

✔️ 검정력(Power) 개념

✔️ 검정 종류별 분포(t, z, F, χ²)


🌈 한 줄 요약 ✨

🧠 통계적 가설검정

📊 “귀무가설(H₀)을 데이터로 검증해,

🔎 p-value로 판단하고, ⚖️ 오류를 최소화하는 과정!”