베이지안 추론과 AI

업데이트 2025-04

읽는 시간 8분

AI·통계

1763

베이즈 정리 발표

P(A|B)

사후 확률

4가지

AI 활용 역할

AlphaFold 3

베이지안 신뢰 점수

한눈에 보기 (TL;DR)

베이즈 정리: 사전 지식 + 새 데이터 → 사후 확률 업데이트.
AI에서 4가지 역할: 불확실성 정량화, 소량 데이터 학습, 온라인 학습, 베이지안 최적화.
빈도주의와 달리 모수 자체를 분포로 다루고 사전 정보를 명시적으로 사용.
NeurIPS 2024 — LLM 출력 신뢰도 보정에 베이지안 접근 주류 트랙.
Tesla·Waymo·AlphaFold 3 등 실용 AI에 베이지안이 핵심 컴포넌트로 채택.

Key Facts — 베이지안 추론과 AI

개념	내용
핵심 수식	P(A\|B) = P(B\|A) × P(A) / P(B)
사전 분포	Prior — 관측 전 믿음
우도	Likelihood — 데이터가 가설을 지지하는 정도
사후 분포	Posterior — 갱신된 믿음
AI 응용	LLM 보정, 자율주행 위치추정, AutoML
AlphaFold 3	pTM 점수로 구조 신뢰도 정량화

출처: Pattern Recognition and Machine Learning (Bishop), NeurIPS 2024 Proceedings, AlphaFold 3 Paper (Nature 2024)

핵심 인사이트

“확률은 빈도가 아니라 믿음의 강도”라는 베이즈의 200년 된 통찰이 현대 AI의 불확실성 처리의 표준이 됐다.

베이지안 추론(Bayesian Inference)은 사전 지식과 새로운 데이터를 결합해 확률적 믿음을 갱신하는 통계 패러다임이다. 토머스 베이즈의 1763년 정리에 뿌리를 두고 있지만, 21세기 AI 시스템에서 불확실성 정량화·실시간 학습·소량 데이터 추론 등 핵심 영역에서 다시 부상하고 있다.

베이즈 정리 — 한 줄의 힘

P(A|B) = P(B|A) × P(A) / P(B). 새로운 증거 B가 관측되었을 때 가설 A의 확률을 어떻게 업데이트할지 알려주는 식이다. 이 단순한 수식이 의료 진단, 스팸 필터, 자율주행 위치 추정, LLM의 토큰 선택까지 광범위하게 작동한다.

AI에서 베이지안의 4가지 역할

불확실성 정량화: “이 예측이 얼마나 확신스러운가”를 분포로 제공
소량 데이터 학습: 사전 분포로 데이터 부족 보완
온라인 학습: 새로운 관측마다 posterior 갱신
AutoML 최적화: 베이지안 최적화로 하이퍼파라미터 탐색

베이지안 vs 빈도주의

빈도주의(Frequentist)는 모수를 고정된 값으로 보고 반복 표본의 분포로 추론한다. 베이지안은 모수 자체를 분포로 다루며 사전 정보를 명시적으로 통합한다. 의료 진단처럼 사전 유병률이 명확한 영역에서 베이지안이 명백히 우월하다.

자주 묻는 질문

“사전 믿음에 새 증거를 곱해서 사후 믿음으로 업데이트하는 공식”입니다. 예: 환자가 양성 검사 결과를 받았을 때 진짜 양성일 확률은 사전 유병률 × 검사 민감도 / 전체 양성 비율로 계산됩니다.

주로 출력의 신뢰도 보정(calibration)에 사용됩니다. LLM이 ‘확신한다’고 말한 답이 실제로 맞을 확률을 추정하는 데 베이지안 후처리(예: temperature scaling, MC dropout)가 활용됩니다.

센서 데이터(라이다, 카메라, GPS)는 각각 노이즈가 있어 단일 측정으로 정확한 위치를 알 수 없습니다. 칼만 필터(Kalman Filter)나 파티클 필터 같은 베이지안 추정기가 여러 센서의 정보를 결합해 최적 위치를 추정합니다.

전통적인 MCMC는 계산이 매우 무거웠으나, 변분추론(VI)과 라플라스 근사 등이 신경망과 결합되며 실용 속도를 확보했습니다. 또한 베이지안 신경망 라이브러리(Pyro, TensorFlow Probability)가 표준화되었습니다.

최종 업데이트: 2025-04 · NeurIPS 2024, AlphaFold 3 사례 반영