🧪✨ 통계적 가설 검정 완벽 정리 💡
귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향
🎯 1️⃣ 가설 검정이란?
📊 “데이터를 통해 모집단에 대한 주장(H₀) 이 맞는지 검정하는 과정!”
💬 쉽게 말하면,
👉 “데이터로 가설이 맞는지 따져보는 절차”예요.
🏳️🌈 2️⃣ 귀무가설 (H₀ : Null Hypothesis)
“차이 없음, 변화 없음, 효과 없음”이라는 기본 주장이에요.
📘 예시
- 💊 신약의 효과가 기존 약과 같다.
- 👩🏫 남녀 평균 점수는 같다.
- 💻 A/B 버전 전환율에 차이가 없다.
💡 핵심: 귀무가설은 “지금 상태 유지”의 주장!
🏴☠️ 3️⃣ 대립가설 (H₁ or Hₐ : Alternative)
“귀무가설이 틀렸을 때 참이 되는 주장” ⚡
📘 예시
- 💊 신약이 기존 약보다 효과가 다르다.
- 👩🏫 남녀 평균 점수가 다르다.
- 💻 A/B 전환율이 다르다.
💡 즉, 검정의 목표는 H₀를 기각하고 H₁를 지지하는 것!
📉 4️⃣ 유의확률 (p-value)
🎯 “H₀가 참이라고 가정했을 때, 관찰된 결과만큼 극단적인 결과가 나올 확률!”
📘 해석
- p-value가 작을수록 → H₀ 하에서 보기 힘든 결과 → H₀ 기각 가능성 높음
💡 결정 기준
✅ p ≤ α → H₀ 기각 (유의함)
❌ p > α → H₀ 기각 못 함 (유의하지 않음)
📊 예시
p = 0.02 → 2%의 확률밖에 없으니 H₀ 기각!
📏 5️⃣ 검정 통계량 (Test Statistic)
데이터에서 계산한 증거의 크기 📐
| 상황 | 검정 통계량 | 사용하는 분포 |
| 평균 비교 | t | t분포 |
| 비율 비교 | z | 정규분포 |
| 분산 비교 | F | F분포 |
| 적합도 / 독립성 | χ² | 카이제곱분포 |
💬 검정통계량이 크면 → H₀로부터 멀다 → 기각 가능성↑
🔒 6️⃣ 유의수준 (α : Significance Level)
💬 “H₀를 기각할 기준선”
📏 보통 0.05 (5%), 때로는 0.01(1%) 사용
📘 의미
- α = 0.05 → “귀무가설이 참인데도 5% 확률로 잘못 기각할 수 있다.”
- 💡 즉, 1종 오류 허용 한계!
⚠️ 7️⃣ 오류의 두 가지 😱
| 구분 | 실제상황 | 판단 | 의미 | 예시 |
| 🚨 1종 오류(α) | H₀ 참 | H₀ 기각 | “맞는 걸 틀렸다고 함” | 무고한 사람 처벌 ⚖️ |
| 💤 2종 오류(β) | H₀ 거짓 | H₀ 유지 | “틀린 걸 놓침” | 진짜 범인 놓침 🔍 |
💡 검정력(Power) = 1 – β
→ 실제로 차이가 있을 때 잘 잡아내는 능력 💪
→ 표본 수 ↑, 효과 크기 ↑, 분산 ↓ → Power ↑
🧭 8️⃣ 양측검정 vs 단측검정
| 구분 | 의미 | 대립가설 | 방향 | 그림 |
| ⚖️ 양측검정 | “다르다” | H₁: μ ≠ μ₀ | 양쪽 꼬리 | ⬅️➡️ |
| 👉 우측검정 | “크다” | H₁: μ > μ₀ | 오른쪽 | ➡️ |
| 👈 좌측검정 | “작다” | H₁: μ < μ₀ | 왼쪽 | ⬅️ |
💬 예시
- “A제품이 B보다 크다” → 우측검정
- “A제품이 B와 다르다” → 양측검정
⚠️ 주의: 방향은 “사전에” 정해야 해요! (데이터 본 뒤 변경 ❌)
🧮 9️⃣ 가설 검정 5단계 절차 ✏️
| 단계 | 내용 | 예시 |
| ① | 가설 설정 | H₀: μ=3, H₁: μ≠3 |
| ② | 유의수준 설정 | α=0.05 |
| ③ | 검정통계량 계산 | t, z, F 등 |
| ④ | p-value 계산 | p와 α 비교 |
| ⑤ | 결과 해석 | “H₀ 기각 / 유지” 결론 도출 |
📊 10️⃣ 예시 — 1표본 t검정 ✨
상황:
고객 만족도 평균이 3.0인지 확인!
표본: n=36, 𝑥̄=3.25, s=0.6, α=0.05
H₀: μ = 3.0 H₁: μ ≠ 3.0 (양측)
계산
t = (3.25 – 3.0) / (0.6 / √36) = 0.25 / 0.1 = 2.5
판단
p ≈ 0.017 < 0.05 → ✅ H₀ 기각
💬 결론:
“만족도 평균은 3.0보다 유의하게 다르다(상승했다).”
🧾 11️⃣ 검정 선택 가이드 💡
| 검정 목적 | 데이터 형태 | 검정 종류 |
| 평균 = μ₀ | 연속형 | 1표본 t |
| 평균 비교(두 집단) | 연속형 | 독립 2표본 t |
| 비율 = p₀ | 범주형 | 1표본 z |
| 두 비율 비교 | 범주형 | 2표본 z |
| 3집단 이상 평균 | 연속형 | ANOVA(F) |
| 분산 비교 | 연속형 | F검정 |
| 범주형 적합도 | 범주형 | χ²검정 |
📘 12️⃣ 공식 🧮
평균 t검정
t = (x̄ – μ₀) / (s / √n)
df = n – 1
기각기준: |t| ≥ t*(α/2, df) ⇔ p ≤ α
비율 z검정
z = (p̂ – p₀) / √(p₀(1-p₀)/n)
기각기준: |z| ≥ z*(α/2) ⇔ p ≤ α
오류와 검정력
1종 오류 = α
2종 오류 = β
검정력(Power) = 1 – β
💎 13️⃣ 핵심 요약 💬
✨ 가설검정 핵심 문장 ✨
“데이터로 H₀(기존 주장)을 의심하고,
p-value와 α를 비교해 통계적으로 유의한가 판단한다!”
📊 기억 공식
- p < 0.05 → ✅ “유의하다! (H₀ 기각)”
- p > 0.05 → ❌ “유의하지 않다 (H₀ 유지)”
✅ ADsP 시험 핵심 체크리스트 🔥
✔️ 귀무가설 vs 대립가설 의미
✔️ p-value와 α 비교 규칙
✔️ 1·2종 오류 구분
✔️ 양측/단측 판단 기준
✔️ 검정력(Power) 개념
✔️ 검정 종류별 분포(t, z, F, χ²)
🌈 한 줄 요약 ✨
🧠 통계적 가설검정은
📊 “귀무가설(H₀)을 데이터로 검증해,
🔎 p-value로 판단하고, ⚖️ 오류를 최소화하는 과정!”