🎲 이산형 확률분포 완전정리 💡
ADsP(데이터분석 준전문가) 필수 확률 파트 정리 ✏️
📌 1️⃣ 이산형 확률분포란?
🎯 이산형 확률분포(Discrete Probability Distribution)
: 확률변수가 0, 1, 2…처럼 셀 수 있는 값만 가지는 분포예요.
즉, “결과가 정수로 딱딱 떨어지는 사건”에 대한 확률을 계산하는 모델이에요!
예를 들어 👇
- 동전 던지기 → 앞면(1) / 뒷면(0)
- 주사위 → 1~6
- 고객 10명 중 구매한 사람 수 (0~10명)
이런 것들이 모두 이산형 확률분포로 표현됩니다 😊
📊 2️⃣ 대표적인 이산형 확률분포 7가지
| 분포명 | 키워드 | 예시 |
| 🎯 베르누이 분포 (Bernoulli) | 한 번의 성공 or 실패 | 동전 한 번 던지기 |
| 🎯🎯 이항 분포 (Binomial) | 여러 번의 성공 횟수 | 10명 중 구매한 사람 수 |
| 🔁 기하 분포 (Geometric) | 첫 성공까지 걸린 횟수 | 몇 번째에 합격할까? |
| 🔁🔁 음이항 분포 (Negative Binomial) | r번째 성공까지 걸린 횟수 | 3번째 합격까지 몇 번? |
| 📞 포아송 분포 (Poisson) | 일정 시간 동안 발생 횟수 | 1시간 내 콜센터 전화 수 |
| 🎣 초기하 분포 (Hypergeometric) | 비복원 추출 | 다시 넣지 않고 불량품 뽑기 |
| ⚖️ 이산 균등 분포 (Discrete Uniform) | 모든 값이 동일 확률 | 주사위 눈 1~6 |
🎯 3️⃣ 각 분포별 핵심 정리
✅ 1. 베르누이 분포 (Bernoulli)
- 특징: 한 번의 시행, 성공(1) 또는 실패(0)
- 모수: 성공확률 p
- 평균: p
- 분산: p(1−p)
- 📌 예시: 동전 한 번 던져 앞면(1) 나올 확률
✅ 2. 이항 분포 (Binomial)
- 특징: n번 독립 시행 중 성공 횟수
- 모수: 시행횟수 n, 성공확률 p
- 평균: np
- 분산: np(1−p)
- 📌 예시:
- 100명에게 메일 보냈을 때, 클릭한 사람 수
💡 Tip:
- n이 충분히 크면 → 정규분포 근사 가능
- p가 작고 n이 크면 → 포아송 분포 근사 가능
✅ 3. 기하 분포 (Geometric)
- 특징: 첫 성공이 나올 때까지 걸린 시행 횟수
- 평균: 1/p
- 성질: 기억없음(Memoryless)
- 📌 예시: 몇 번째에 처음 합격할까?
💬 “한 번 실패했다고 다음에 성공할 확률이 달라지지 않는다” → 기억없음 특성 🎯
✅ 4. 음이항 분포 (Negative Binomial)
- 특징: r번째 성공까지 필요한 시행 횟수
- 평균: r/p
- 분산: r(1−p)/p²
- 📌 예시: 3번째 합격까지 걸린 응시 횟수
👉 기하분포의 확장형 (r=1이면 기하분포!)
✅ 5. 포아송 분포 (Poisson)
- 특징: 일정 시간/공간 내 발생 건수
- 모수: λ(평균 발생 수)
- 평균=분산=λ
- 📌 예시:
- 1시간 동안 고객 문의 수, 1분당 버스 도착 수
💡 Binomial 근사
Bin(n,p)에서 n→∞, p→0, np=λ이면 Poisson(λ)
✅ 6. 초기하 분포 (Hypergeometric)
- 특징: 모집단에서 비복원 추출 시 성공 개수
- 모수: 모집단 N, 성공 K, 표본 n
- 평균: n(K/N)
- 📌 예시:
- 50개 중 불량품 5개 → 10개 뽑았을 때 불량 2개 나올 확률
💡 이항과의 차이점
- 복원추출 → 이항
- 비복원 → 초기하
✅ 7. 이산 균등 분포 (Discrete Uniform)
- 특징: 가능한 모든 값이 동일 확률
- PMF: P(X=x)=1/(b−a+1)
- 📌 예시:
- 주사위(1~6) → 각 눈의 확률 1/6
📘 4️⃣ 이산형 분포 쉽게 외우는 방법 💡
| 상황 키워드 | 분포 이름 |
| 1번 성공 or 실패 | 베르누이 |
| 여러 번 중 성공 횟수 | 이항 |
| 첫 성공까지 시행 수 | 기하 |
| r번째 성공까지 시행 수 | 음이항 |
| 일정 시간 내 발생 횟수 | 포아송 |
| 비복원 추출 성공 수 | 초기하 |
| 모두 동일한 확률 | 이산 균등 |
💬 외우기 팁 👉
“1·n·첫·r·시간·비·동일” → 베르누이·이항·기하·음이항·포아송·초기하·균등 🎯
🧮 5️⃣ 예시로 감 잡기 ✨
🎲 예시 1
주사위를 10번 던져 6이 나올 횟수
→ 이항분포 Bin(10, 1/6)
☎️ 예시 2
1시간 동안 콜센터에 걸려온 전화 수
→ 포아송분포 Pois(λ)
🎓 예시 3
학생이 처음 합격할 때까지 본 시험 횟수
→ 기하분포 Geo(p)
⚠️ 6️⃣ 시험에서 자주 틀리는 포인트
🚫 복원 / 비복원 구분 (이항 vs 초기하)
🚫 포아송 = 평균과 분산이 같다
🚫 기하, 지수만 기억없음
🚫 근사 조건 (Bin→Norm, Bin→Pois)
🚫 각 분포 평균/분산 헷갈림 주의
🌈 한 줄 요약
🎯 이산형 확률분포는
“결과가 정수로 나오는 사건의 확률”을 설명하는 분포예요.
상황 키워드로 분포를 구분하면 100% 정답! ✅