t-분포 & t-검정, 쉽게 끝내기_ADsP 3과목

🧪 t-분포 & t-검정 완전 정리

σ(모표준편차)를 모를 때 사용하는 평균 검정 도구


🎯 1️⃣ t-분포란?

t-분포는 표본의 크기가 작고, 모표준편차(σ)를 모를 때 사용하는 분포예요.

정규분포와 생김새는 비슷하지만 꼬리가 조금 더 두꺼워요.

즉, 표본이 적을 때 생길 수 있는 불확실성을 반영한 분포입니다.

표본이 커질수록(자유도 df가 커질수록) t-분포는 정규분포와 거의 같아집니다.


🧭 2️⃣ 언제 t-검정을 쓰나요?

  • σ(모표준편차)를 모를 때 ✅
  • 표본이 작은 경우(n < 30) ✅
  • 평균 차이를 검정하고 싶을 때 ✅

즉, 현실의 대부분 상황에서 z검정보다 t검정을 사용하게 됩니다.


🧰 3️⃣ t-검정의 세 가지 종류

📦 ① 1표본 t-검정

표본의 평균이 어떤 기준값(μ₀)과 다른지를 비교

예를 들어 “고객 만족도 평균이 3점과 다른가?”

또는 “제품의 평균 무게가 1kg과 차이가 있는가?”를 검정할 때 사용합니다.

검정 결과 p값이 0.05보다 작으면

→ “평균이 기준값과 유의하게 다르다”고 해석합니다.


👥 ② 독립 2표본 t-검정

서로 다른 두 그룹의 평균이 같은지를 비교

예를 들어 “남자와 여자의 평균 구매액이 같은가?”

또는 “광고 A와 B의 클릭률이 차이가 있는가?”를 검정할 때 사용합니다.

  • 두 그룹의 분산이 비슷하다고 가정할 수 있으면 ‘등분산 t-검정’을,
  • 분산이 다를 가능성이 크면 ‘웰치(Welch) t-검정’을 사용합니다.

웰치 검정은 실무에서 더 많이 쓰입니다.


🔁 ③ 쌍체 t-검정

같은 집단을 대상으로 전후(또는 쌍으로 연결된) 데이터를 비교

예를 들어 “교육 전과 후의 시험 점수가 달라졌는가?”

“운동 전후 체중 변화가 있는가?” 같은 경우에 사용합니다.

데이터가 서로 짝지어진 형태이기 때문에,

“전 – 후”의 차이를 계산해서 그 평균이 0인지 검정합니다.


📏 4️⃣ 검정 방향(양측 vs 단측)

구분대립가설언제 사용설명
⚖️ 양측검정μ ≠ μ₀단순히 다름만 확인기본 형태
👉 우측검정μ > μ₀평균이 더 큰지 확인예: 신제품이 더 좋다
👈 좌측검정μ < μ₀평균이 더 작은지 확인예: 점수가 떨어졌다

방향은 검정 전에 정해야 하며,

데이터를 보고 나중에 바꾸면 안 됩니다. (유의수준 왜곡 위험)


🧮 5️⃣ 예시로 쉽게 이해하기

예시 1) 1표본 t검정

고객 평균 점수가 70점과 다른지 확인합니다.

표본평균은 72점, 표본표준편차 10, 표본수 25개입니다.

→ 검정 결과 p값이 약 0.33으로, 0.05보다 큽니다.

즉, 평균이 70과 유의하게 다르다고 보기 어렵습니다.


예시 2) 독립 2표본 t검정 (Welch)

남자 평균 75점(표준편차 8, n=20),

여자 평균 70점(표준편차 7, n=22).

검정 결과 p값 ≈ 0.03으로, 0.05보다 작습니다.

즉, 남녀 평균 점수 차이가 통계적으로 유의합니다.


예시 3) 쌍체 t검정

교육 전후 점수 차이를 비교합니다.

차이 평균이 0.3, 표준편차 0.4, 표본 15명이라면,

검정 결과 p값 ≈ 0.006으로 교육 후 점수가 유의하게 향상되었다고 볼 수 있습니다.


⚙️ 6️⃣ t-검정의 전제 조건(가정)

가정의미확인 방법
📈 정규성데이터가 너무 한쪽으로 치우치지 않아야 함Q-Q Plot, 샤피로 검정
🔗 독립성표본 간 간섭이 없어야 함설계 단계에서 확인
⚖️ 등분산성두 집단의 분산이 비슷해야 함레빈(Levene) 검정

💡 정규성 위반이 심하면 순위검정(비모수 검정)

예: 윌콕슨, 맨-휘트니 검정을 대신 사용합니다.


🧠 7️⃣ 검정 결과 해석 방법

1️⃣ t값 계산

2️⃣ 자유도(df) 확인

3️⃣ p값 계산

4️⃣ p ≤ 0.05 → 귀무가설 기각 / p > 0.05 → 기각 못 함

5️⃣ 문장으로 해석 작성

예시:

“유의수준 5%에서 두 집단의 평균은 통계적으로 유의하게 다르다.”

(t=2.15, df=31.8, p=0.039)


📈 8️⃣ 신뢰구간과 효과크기

  • 신뢰구간(CI): 실제 평균이 포함될 가능성이 높은 범위
  • 효과크기(Cohen’s d): 차이의 크기를 수치로 표현
  • d = 0.2 → 작음
  • d = 0.5 → 중간
  • d = 0.8 → 큼

즉, 통계적으로 유의한지(p값) 뿐 아니라

**실제로 의미 있는 차이인지(효과크기)**도 함께 보아야 합니다.


❗ 9️⃣ 자주 하는 실수

  • p값이 0.05보다 크다고 해서 귀무가설이 참이라는 뜻은 아님.
  • → “증거가 부족하다”로 해석해야 합니다.
  • 검정 방향(양측/단측)을 사후에 바꾸면 안 됨.
  • 등분산이 애매할 때는 Welch t검정 사용.
  • 표준편차 σ를 모르면 z검정이 아니라 t검정을 사용해야 함.

🌈 10️⃣ 한 줄 요약

💡 t-검정은 “모표준편차를 모를 때 평균(또는 평균 차이)”을 검정하는 기본 도구.

📊 Welch t검정이 실무 기본, 신뢰구간과 효과크기를 함께 제시하면 완벽합니다. ✅