- Bayes' theorem
- 사건 A와 B가 있을 때 사전(prior) 확률 P(A)과 사후(posterior) 확률 P(A|B) 사이의 관계를 조건부 확률 P(A|B)를 이용해서 계산하는 확률 이론
공식
- P(A|B) = P(A)P(B|A)/P(B) = P(A∩B)/P(B)
- P(A): 사전확률, A일 확률
- P(B|A): 조건부 확률, 사건 A로 인하여 B가 일어날 확률
- P(A|B): 사후확률, 사건 B로 인하여 A가 일어날 확률
- P(B): B가 일어날 확률
- = P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3) + ... + P(An)P(B|An)
예시
- P(채무불이행): 채무불이행 확률
- P(채무불이행|직업='선생님'): 선생님이 채무를 불이행할 확률
- P(직업='선생님'|채무불이행): 채무를 불이행한 사람이 선생님일 확률
- P(직업=선생님): 직업이 선생님일 확률
활용
베이즈 정리는 불확실한 상황에서 정보를 업데이트하는 강력한 도구이다. 새로운 증거가 나타날 때마다 확률을 재계산할 수 있게 해주며, 이를 통해 보다 정확한 예측이 가능하다.
- 실제생활에서는 사후 확률만 알고 있는 경우가 많음
- 사전 확률과 사휴 확률 사이의 관계를 조건부 확률을 이용해서 계산하는 확률 이론
예제
예제 문제1
- 누군가가 유방조영술을 받았는데 결과가 양성이었다.
- 유방암 환자가 유방조영술이 양성일 확률은 90%이다.
- 유방암이 아니더라도 유방조영술이 양성일 확률은 7%이다.
- 40~50대에 유방암일 확률이 0.8%이다.
- 유방조영술 양성자가 유방암일 경우는?
예제 풀이1
- 유방암에 걸릴 확률(사전 확률) P(A) = 0.8%
- 검사 결과가 양성일 확률 P(B) = 0.8%의 90% + 99.2%의 7%
- = 0.008 * 0.9 + 0.992 * 0.07 = 0.0766 = 7.7%
- 유방암일 때 검사결과가 양성일 확률(조건부 확률) P(B|A) = 90%
- 검사 결과가 양성일 때 유방암에 걸렸을 확률(사후 확률) P(A|B) = 0.8% * 90% / 7.7%
- = 0.008 * 0.9 / 0.077 = 0.0935 = 9.4%
예제 문제2
- 공정1, 공정2, 공정3에서 생산량의 50%, 30%, 20%를 각각 생산
- 공정1, 공정2, 공정3에서 불량품은 3%, 2%, 1%
- 불량품이 하나 나왔을 때 이 제품이 공정1에서 생산된 제품일 확률
예제 풀이2
- 불량품임을 감안하지 않고, 제품이 각 공정에서 생산되었을 확률
- 공정1: P(A1) = 0.5
- 공정2: P(A2) = 0.3
- 공정2: P(A2) = 0.2
- 각 공정에서 생산된 제품의 불량 확률
- 공정1: P(B|A1) = 0.03
- 공정2: P(B|A2) = 0.02
- 공정2: P(B|A2) = 0.01
- 불량품이 나올 전체 확률
- P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3)
- = 0.5 * 0.03 + 0.3 * 0.02 + 0.2 * 0.01 = 0.023
- 불량품이 A1에서 나왔을 확률
- P(A1|B)
- = P(A1)P(B|A1)/P(B)
- = 0.5 * 0.03 / 0.023 = 0.65