🎲 확률과 🔗 조건부 확률 완전 정리 💡
ADsP(데이터분석 준전문가) 필수 핵심 개념
🎯 확률(Probability)이란?
어떤 사건이 일어날 가능성을 0과 1 사이의 숫자로 나타낸 것이에요.
예를 들어 👇
- 주사위를 던졌을 때 ‘짝수’가 나올 확률 = 3/6 = 0.5 (50%)
- 동전을 던졌을 때 ‘앞면’이 나올 확률 = 1/2 (50%)
📘 확률의 기본 성질
| 성질 | 수식 | 의미 |
| 🎯 확률 범위 | 0 ≤ P(A) ≤ 1 | 0이면 불가능, 1이면 확실 |
| ⚖️ 전체 확률 | P(전체) = 1 | 모든 경우의 합은 항상 1 |
| 🔁 여사건 | P(Aᶜ) = 1 − P(A) | A가 아닐 확률 |
💡 예시: “비 올 확률이 30%”라면
비가 안 올 확률은 70%입니다 ☀️
🧩 확률의 기본 법칙
➕ 덧셈법칙 (Addition Rule)
두 사건 A, B 중 하나 이상이 일어날 확률
| 구분 | 수식 | 설명 |
| ⚡ 배반사건 | P(A ∪ B) = P(A) + P(B) | 동시에 일어날 수 없음 |
| 🔄 일반적인 경우 | P(A ∪ B) = P(A) + P(B) − P(A ∩ B) | 중복되는 부분 빼주기 |
✖️ 곱셈법칙 (Multiplication Rule)
두 사건이 같이 일어날 확률
| 구분 | 수식 | 설명 |
| ✅ 독립사건 | P(A ∩ B) = P(A) × P(B) | 서로 영향 없음 |
| ⚠️ 의존사건 | P(A ∩ B) = P(A) × P(B | A) |
💬 예시
“동전 앞면”과 “주사위 짝수” → 독립
“비가 올 때 우산을 쓸 확률” → 의존
🔗 조건부 확률 (Conditional Probability)
이미 어떤 사건이 일어났다고 했을 때,
그 조건 안에서 다른 사건이 일어날 확률이에요.
📘 공식
P(A|B) = P(A ∩ B) / P(B)
“B가 일어났을 때 A가 일어날 확률”
즉, 전체 중 B에 속한 부분에서 A가 차지하는 비율입니다.
💡 예시
비가 오는 날(B)에 우산을 가지고 올 확률(A)
| 구분 | 사람 수 | 확률 |
| 비 오는 날 전체 | 100명 | P(B)=100명 |
| 그중 우산을 쓴 사람 | 80명 | P(A∩B)=80명 |
👉 P(A|B) = 80/100 = 0.8 (80%)
비 오는 날을 기준으로 보니,
“우산 쓸 확률”은 80%로 계산되는 거예요 ☔
🧠 베이즈 정리 (Bayes’ Theorem)
조건부 확률을 반대로 구하는 공식이에요.
새로운 정보가 생겼을 때, 확률을 업데이트하는 방법입니다.
📘 공식
P(A|B) = [ P(B|A) × P(A) ] / P(B)
💬 예시
“검사 결과가 양성일 때, 실제로 병이 있을 확률”을 구할 때 사용합니다.
🧩 이해 예시 — 질병 검사
| 구분 | 실제 병 있음 | 실제 병 없음 | 합계 |
| 검사 양성(+) | 90 | 90 | 180 |
| 검사 음성(−) | 10 | 8,810 | 8,820 |
| 합계 | 100 | 8,900 | 9,000 |
- P(D) = 100/9000 = 0.0111
- P(+|D) = 90/100 = 0.9
- P(+|Dᶜ) = 90/8900 = 0.01
계산:
P(D|+) = (0.9×0.0111) / [(0.9×0.0111)+(0.01×0.9889)]
= 약 0.50 (50%)
⚠️ 즉, 검사 양성이 나와도 실제 병일 확률은 절반 정도일 수 있어요!
(이게 바로 베이즈 정리의 중요 포인트예요)
⚖️ 독립 vs 배반 정리
| 구분 | 의미 | 수식 | 예시 |
| 🔹 독립사건 | 서로 영향 없음 | P(A∩B)=P(A)×P(B) | 동전과 주사위 |
| 🔸 배반사건 | 동시에 불가능 | P(A∩B)=0 | 짝수 vs 홀수 |
💡 정리
배반사건 → 같이 일어날 수 없다 🚫
독립사건 → 서로 영향이 없다 🤝
🧮 쉬운 예시로 이해하기
🎯 예시 1) 주사위
A: “짝수”, B: “3의 배수”
- P(A)=3/6=0.5
- P(B)=2/6=0.333…
- P(A∩B)=1/6
👉 P(A|B) = (1/6)/(2/6) = 0.5
“3의 배수가 나왔다”는 조건에서, 짝수일 확률은 50%예요!
🎯 예시 2) 질병 확률
- 병 걸릴 확률: 1%
- 병일 때 양성일 확률: 90%
- 병이 아닐 때도 양성일 확률: 10%
P(D|+) = (0.9×0.01) / [(0.9×0.01)+(0.1×0.99)]
= 0.009 / 0.108 = 약 8.3%
“양성이 나와도 실제 병일 확률은 8% 정도”
→ **희귀질환에서는 오탐(위양성)**이 많다는 의미예요.
🧠 시험 포인트 요약
📌 조건부 확률: P(A|B) = P(A∩B)/P(B)
📌 베이즈 정리: P(A|B) = [P(B|A)×P(A)]/P(B)
📌 독립 vs 배반 구분
📌 덧셈법칙, 곱셈법칙 정확히 기억
📌 전확률 법칙: P(B)=ΣP(B|Aᵢ)P(Aᵢ)
🌈 한 줄 요약
🎯 확률은 “가능성의 수학”
🔗 조건부 확률은 “조건이 주어졌을 때의 가능성”
💡 베이즈 정리는 “새로운 정보로 확률을 갱신하는 방법”