통계적 가설 검정 완벽 정리 (귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향)_ADsP 3과목

🧪✨ 통계적 가설 검정 완벽 정리 💡

귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향

🎯 1️⃣ 가설 검정이란?

📊 “데이터를 통해 모집단에 대한 주장(H₀) 이 맞는지 검정하는 과정!”

💬 쉽게 말하면,

👉 “데이터로 가설이 맞는지 따져보는 절차”예요.

🏳️‍🌈 2️⃣ 귀무가설 (H₀ : Null Hypothesis)

“차이 없음, 변화 없음, 효과 없음”이라는 기본 주장이에요.

📘 예시

💊 신약의 효과가 기존 약과 같다.
👩‍🏫 남녀 평균 점수는 같다.
💻 A/B 버전 전환율에 차이가 없다.

💡 핵심: 귀무가설은 “지금 상태 유지”의 주장!

🏴‍☠️ 3️⃣ 대립가설 (H₁ or Hₐ : Alternative)

“귀무가설이 틀렸을 때 참이 되는 주장” ⚡

📘 예시

💊 신약이 기존 약보다 효과가 다르다.
👩‍🏫 남녀 평균 점수가 다르다.
💻 A/B 전환율이 다르다.

💡 즉, 검정의 목표는 H₀를 기각하고 H₁를 지지하는 것!

📉 4️⃣ 유의확률 (p-value)

🎯 “H₀가 참이라고 가정했을 때, 관찰된 결과만큼 극단적인 결과가 나올 확률!”

📘 해석

p-value가 작을수록 → H₀ 하에서 보기 힘든 결과 → H₀ 기각 가능성 높음

💡 결정 기준

✅ p ≤ α → H₀ 기각 (유의함)

❌ p > α → H₀ 기각 못 함 (유의하지 않음)

📊 예시

p = 0.02 → 2%의 확률밖에 없으니 H₀ 기각!

📏 5️⃣ 검정 통계량 (Test Statistic)

데이터에서 계산한 증거의 크기 📐

상황	검정 통계량	사용하는 분포
평균 비교	t	t분포
비율 비교	z	정규분포
분산 비교	F	F분포
적합도 / 독립성	χ²	카이제곱분포

💬 검정통계량이 크면 → H₀로부터 멀다 → 기각 가능성↑

🔒 6️⃣ 유의수준 (α : Significance Level)

💬 “H₀를 기각할 기준선”

📏 보통 0.05 (5%), 때로는 0.01(1%) 사용

📘 의미

α = 0.05 → “귀무가설이 참인데도 5% 확률로 잘못 기각할 수 있다.”
💡 즉, 1종 오류 허용 한계!

⚠️ 7️⃣ 오류의 두 가지 😱

구분	실제상황	판단	의미	예시
🚨 1종 오류(α)	H₀ 참	H₀ 기각	“맞는 걸 틀렸다고 함”	무고한 사람 처벌 ⚖️
💤 2종 오류(β)	H₀ 거짓	H₀ 유지	“틀린 걸 놓침”	진짜 범인 놓침 🔍

💡 검정력(Power) = 1 – β

→ 실제로 차이가 있을 때 잘 잡아내는 능력 💪

→ 표본 수 ↑, 효과 크기 ↑, 분산 ↓ → Power ↑

🧭 8️⃣ 양측검정 vs 단측검정

구분	의미	대립가설	방향	그림
⚖️ 양측검정	“다르다”	H₁: μ ≠ μ₀	양쪽 꼬리	⬅️➡️
👉 우측검정	“크다”	H₁: μ > μ₀	오른쪽	➡️
👈 좌측검정	“작다”	H₁: μ < μ₀	왼쪽	⬅️

💬 예시

“A제품이 B보다 크다” → 우측검정
“A제품이 B와 다르다” → 양측검정

⚠️ 주의: 방향은 “사전에” 정해야 해요! (데이터 본 뒤 변경 ❌)

🧮 9️⃣ 가설 검정 5단계 절차 ✏️

단계	내용	예시
①	가설 설정	H₀: μ=3, H₁: μ≠3
②	유의수준 설정	α=0.05
③	검정통계량 계산	t, z, F 등
④	p-value 계산	p와 α 비교
⑤	결과 해석	“H₀ 기각 / 유지” 결론 도출

📊 10️⃣ 예시 — 1표본 t검정 ✨

상황:

고객 만족도 평균이 3.0인지 확인!

표본: n=36, 𝑥̄=3.25, s=0.6, α=0.05

H₀: μ = 3.0 H₁: μ ≠ 3.0 (양측)

계산

t = (3.25 – 3.0) / (0.6 / √36) = 0.25 / 0.1 = 2.5

판단

p ≈ 0.017 < 0.05 → ✅ H₀ 기각

💬 결론:

“만족도 평균은 3.0보다 유의하게 다르다(상승했다).”

🧾 11️⃣ 검정 선택 가이드 💡

검정 목적	데이터 형태	검정 종류
평균 = μ₀	연속형	1표본 t
평균 비교(두 집단)	연속형	독립 2표본 t
비율 = p₀	범주형	1표본 z
두 비율 비교	범주형	2표본 z
3집단 이상 평균	연속형	ANOVA(F)
분산 비교	연속형	F검정
범주형 적합도	범주형	χ²검정

📘 12️⃣ 공식 🧮

평균 t검정

t = (x̄ – μ₀) / (s / √n)

df = n – 1

기각기준: |t| ≥ t*(α/2, df) ⇔ p ≤ α

비율 z검정

z = (p̂ – p₀) / √(p₀(1-p₀)/n)

기각기준: |z| ≥ z*(α/2) ⇔ p ≤ α

오류와 검정력

1종 오류 = α

2종 오류 = β

검정력(Power) = 1 – β

💎 13️⃣ 핵심 요약 💬

✨ 가설검정 핵심 문장 ✨

“데이터로 H₀(기존 주장)을 의심하고,

p-value와 α를 비교해 통계적으로 유의한가 판단한다!”

📊 기억 공식

p < 0.05 → ✅ “유의하다! (H₀ 기각)”
p > 0.05 → ❌ “유의하지 않다 (H₀ 유지)”

✅ ADsP 시험 핵심 체크리스트 🔥

✔️ 귀무가설 vs 대립가설 의미

✔️ p-value와 α 비교 규칙

✔️ 1·2종 오류 구분

✔️ 양측/단측 판단 기준

✔️ 검정력(Power) 개념

✔️ 검정 종류별 분포(t, z, F, χ²)

🌈 한 줄 요약 ✨

🧠 통계적 가설검정은

📊 “귀무가설(H₀)을 데이터로 검증해,

🔎 p-value로 판단하고, ⚖️ 오류를 최소화하는 과정!”

통계적 가설 검정 완벽 정리 (귀무가설 · 대립가설 · 유의확률 · 검정통계량 · 유의수준 · 오류 · 검정방향)_ADsP 3과목

이 글 공유하기: