🧪 t-분포 & t-검정 완전 정리
σ(모표준편차)를 모를 때 사용하는 평균 검정 도구
🎯 1️⃣ t-분포란?
t-분포는 표본의 크기가 작고, 모표준편차(σ)를 모를 때 사용하는 분포예요.
정규분포와 생김새는 비슷하지만 꼬리가 조금 더 두꺼워요.
즉, 표본이 적을 때 생길 수 있는 불확실성을 반영한 분포입니다.
표본이 커질수록(자유도 df가 커질수록) t-분포는 정규분포와 거의 같아집니다.
🧭 2️⃣ 언제 t-검정을 쓰나요?
- σ(모표준편차)를 모를 때 ✅
- 표본이 작은 경우(n < 30) ✅
- 평균 차이를 검정하고 싶을 때 ✅
즉, 현실의 대부분 상황에서 z검정보다 t검정을 사용하게 됩니다.
🧰 3️⃣ t-검정의 세 가지 종류
📦 ① 1표본 t-검정
표본의 평균이 어떤 기준값(μ₀)과 다른지를 비교
예를 들어 “고객 만족도 평균이 3점과 다른가?”
또는 “제품의 평균 무게가 1kg과 차이가 있는가?”를 검정할 때 사용합니다.
검정 결과 p값이 0.05보다 작으면
→ “평균이 기준값과 유의하게 다르다”고 해석합니다.
👥 ② 독립 2표본 t-검정
서로 다른 두 그룹의 평균이 같은지를 비교
예를 들어 “남자와 여자의 평균 구매액이 같은가?”
또는 “광고 A와 B의 클릭률이 차이가 있는가?”를 검정할 때 사용합니다.
- 두 그룹의 분산이 비슷하다고 가정할 수 있으면 ‘등분산 t-검정’을,
- 분산이 다를 가능성이 크면 ‘웰치(Welch) t-검정’을 사용합니다.
웰치 검정은 실무에서 더 많이 쓰입니다.
🔁 ③ 쌍체 t-검정
같은 집단을 대상으로 전후(또는 쌍으로 연결된) 데이터를 비교
예를 들어 “교육 전과 후의 시험 점수가 달라졌는가?”
“운동 전후 체중 변화가 있는가?” 같은 경우에 사용합니다.
데이터가 서로 짝지어진 형태이기 때문에,
“전 – 후”의 차이를 계산해서 그 평균이 0인지 검정합니다.
📏 4️⃣ 검정 방향(양측 vs 단측)
| 구분 | 대립가설 | 언제 사용 | 설명 |
| ⚖️ 양측검정 | μ ≠ μ₀ | 단순히 다름만 확인 | 기본 형태 |
| 👉 우측검정 | μ > μ₀ | 평균이 더 큰지 확인 | 예: 신제품이 더 좋다 |
| 👈 좌측검정 | μ < μ₀ | 평균이 더 작은지 확인 | 예: 점수가 떨어졌다 |
방향은 검정 전에 정해야 하며,
데이터를 보고 나중에 바꾸면 안 됩니다. (유의수준 왜곡 위험)
🧮 5️⃣ 예시로 쉽게 이해하기
예시 1) 1표본 t검정
고객 평균 점수가 70점과 다른지 확인합니다.
표본평균은 72점, 표본표준편차 10, 표본수 25개입니다.
→ 검정 결과 p값이 약 0.33으로, 0.05보다 큽니다.
즉, 평균이 70과 유의하게 다르다고 보기 어렵습니다.
예시 2) 독립 2표본 t검정 (Welch)
남자 평균 75점(표준편차 8, n=20),
여자 평균 70점(표준편차 7, n=22).
검정 결과 p값 ≈ 0.03으로, 0.05보다 작습니다.
즉, 남녀 평균 점수 차이가 통계적으로 유의합니다.
예시 3) 쌍체 t검정
교육 전후 점수 차이를 비교합니다.
차이 평균이 0.3, 표준편차 0.4, 표본 15명이라면,
검정 결과 p값 ≈ 0.006으로 교육 후 점수가 유의하게 향상되었다고 볼 수 있습니다.
⚙️ 6️⃣ t-검정의 전제 조건(가정)
| 가정 | 의미 | 확인 방법 |
| 📈 정규성 | 데이터가 너무 한쪽으로 치우치지 않아야 함 | Q-Q Plot, 샤피로 검정 |
| 🔗 독립성 | 표본 간 간섭이 없어야 함 | 설계 단계에서 확인 |
| ⚖️ 등분산성 | 두 집단의 분산이 비슷해야 함 | 레빈(Levene) 검정 |
💡 정규성 위반이 심하면 순위검정(비모수 검정)
예: 윌콕슨, 맨-휘트니 검정을 대신 사용합니다.
🧠 7️⃣ 검정 결과 해석 방법
1️⃣ t값 계산
2️⃣ 자유도(df) 확인
3️⃣ p값 계산
4️⃣ p ≤ 0.05 → 귀무가설 기각 / p > 0.05 → 기각 못 함
5️⃣ 문장으로 해석 작성
예시:
“유의수준 5%에서 두 집단의 평균은 통계적으로 유의하게 다르다.”
(t=2.15, df=31.8, p=0.039)
📈 8️⃣ 신뢰구간과 효과크기
- 신뢰구간(CI): 실제 평균이 포함될 가능성이 높은 범위
- 효과크기(Cohen’s d): 차이의 크기를 수치로 표현
- d = 0.2 → 작음
- d = 0.5 → 중간
- d = 0.8 → 큼
즉, 통계적으로 유의한지(p값) 뿐 아니라
**실제로 의미 있는 차이인지(효과크기)**도 함께 보아야 합니다.
❗ 9️⃣ 자주 하는 실수
- p값이 0.05보다 크다고 해서 귀무가설이 참이라는 뜻은 아님.
- → “증거가 부족하다”로 해석해야 합니다.
- 검정 방향(양측/단측)을 사후에 바꾸면 안 됨.
- 등분산이 애매할 때는 Welch t검정 사용.
- 표준편차 σ를 모르면 z검정이 아니라 t검정을 사용해야 함.
🌈 10️⃣ 한 줄 요약
💡 t-검정은 “모표준편차를 모를 때 평균(또는 평균 차이)”을 검정하는 기본 도구.
📊 Welch t검정이 실무 기본, 신뢰구간과 효과크기를 함께 제시하면 완벽합니다. ✅