사전 확률

Priori Probability, Posteriori Probability 사전 확률, 선험적 확률, 사후 확률, 후험적 확률	(2023-08-16)
수정 확률, 역 확률

▷ Top ▷ 기초과학 ▷ 수학 ▷ 확률/통계 ▷ 통계학 ▷ 베이즈 통계학

1. 사전 확률, 선험적 확률 (Priori Probability)

  ㅇ 실제 확률 실험 시행 전에(관측전에), 사건 발생에 대해 이미 알고 있는 확률(믿음)
     - 관측전 현재 정보를 기초로하여 정하는 초기 확률(믿음)
        . 이는 경험,직관 등에 의해 이미 알고있는 확률(믿음)임

  ㅇ 여기서의 확률(믿음)은, 시행전 갖을 수 있는, 주관적 확률을 의미함
     - 이는 시행 후, 상대 빈도로써 확정되는, 객관적 확률과는 다름 
        . (확률의 종류 셋(3) : 이론적 확률, 객관적 확률, 주관적 확률)


2. 사후 확률, 후험적 확률, 수정 확률, 역 확률 (Posteriori Probability)

  ㅇ 사건 발생 후에(관측후에), 그것이 어떤 원인일 것이라고 생각되는(기대되는) 확률
     - 즉, 결과로부터 원인이 무엇일까라는 역방향 확률 (Inverse Probability)

  ㅇ 사후 확률은 직접 구하기 어려워, 사전 확률 및 기타 정보로부터 이를 계산해 냄    ☞ 3.항 참조
     - 주어진 사전 확률로부터, 
     - 관측함에 따라, 어떤 조건이 부과되었을 때, 
     - 이에따라 그렇게 기대되는 확률 값을 계산할 수 있음

  ㅇ 때론, 수정 확률 / 갱신 확률 (Updated Probability) 이라고도 함
     - 즉, 추가된 정보(관측 결과)로부터 사전 확률를 새롭게 수정/정제하여, 
        . 이를 통해 사후 수정 확률을 얻어냄
     - 이렇게 구하는 과정을 `베이즈 갱신 (Bayesian Updating)` 이라고도 함
        . (베이즈 갱신 : 앞의 정보를 이용하여 다음 사후 수정 확률 계산을 위한 사전 확률로 사용)


3. 사후 확률의 표현식 => 베이즈 정리

  ㅇ `사후 확률 P(A|B)`을, `사전 확률 P(A),P(B)과 조건부 확률 P(B|A)`로부터 구할 수 있음
      [# P(A_i|B_j) = \frac{P(B_j|A_i)P(A_i)}{P(B_j)} #]
     - 여기서, {# P(B_j) = \sum^M_{i=1}P(B_j|A_i)P(A_i) #} (전체 확률의 정리)


4. 위의 사후 확률의 표현식에서, 항목별 설명

  ㅇ  A : 원인, 가정, 가설
  ㅇ  B : 관측, 결과
  ㅇ  i = 1,2,...,M : 가설(원인) 종류 (분류 범주/분류 영역/클래스/카테고리 등)
  ㅇ  j = 1,2,... : 관측(샘플)들
  ㅇ  P(A_i|B_j) : 사후 확률 (조건부확률 : 원인의 확률)
     - 관측 B를 보고 원인이 A라고 생각되는(기대되는) 확률 
  ㅇ  P(A_i) : 사전 확률
     - 원인/소스별로 이미 알고있는 확률 (또는, 초기 믿음)
  ㅇ  P(B_j|A_i) : 우도 (조건부 확률 : 결과의 확률)
     - 각각의 원인 A_i로부터 결과 B_j가 나타날 것이라는 가설에 대해 지지하는 정도
     - 나타난 결과 마다 다른 값을 갖는, 여러 가능한 가설들을 평가할 수 있는 조건부확률
  ㅇ  P(B_j) : 해당 결과가 나오도록 모든 원인들 마다 기여하는 확률들의 합
     - 이는, 사후 확률의 값을 정확히 구하는 계산에는 필요한 값이나,
     - 주로, 사후 확률의 크기 비교에 의해 추론/결정/판정을 하므로, 이에 영향을 미치지 않아서, 
     - 통상, 정규화된 상수로 취급하거나 무시함
  ㅇ  한편, 많은 문제에서, 원인이 각 결과에 기여하는 정도가 같고, 정적인 경우가 많으므로,
     - 사전 확률을 계산에 포함(고려) 않음
  ㅇ  한편, `사전 확률`,`우도`는 사전에 훈련 집합을 통해서 구해질 수 있음


5. 한편, 사후 확률을 다음과 같이 표현도 가능

  ㅇ 우도 (Likelihood,조건부 확률), 사전 확률 (Priori), 증거 (Evidence)에 의해서도 표현 가능

      [# P(ω_i|\mathbf{x}) = \frac{P(\mathbf{x}|ω_i)P(ω_i)}{P(\mathbf{x})}
         \qquad     
         \text{posteriori} = \frac{\text{likelihood} \times \text{priori}}{\text{evidence}} #]
     - ω_i : 분류 범주/분류 영역/클래스/카테고리 등 (i = 1,2,...,M)
     - x : 관측 벡터


6. 사후 확률의 계산 例)

  ※ 만일, 결정 규칙(결정 전략)을 세우려면,
     - 각 관측 결과 마다 분류범주 M 번의 확률 계산을 해야 함

     - 例) 관측 결과가 2진수(참/거짓)일 경우에, 2 x M 번의 확률 계산을 하고 살펴보아야 함
        . 이때, 각 결과에서 계산된 사후 확률 값 중 가장 큰 것(가설)을 취하는 것이 합리적임
           .. (사후 확률의 계산은, 베이즈 정리에 따른 위 3,4,5항 참고)
        . 이를두고 최대 사후확률 규칙 이라고 함

  ㅇ 아래의 2진 채널에서, 사후확률을 구해보면,

      

      [# P(X=0|Y=0)              = \frac{P(Y=0|X=0)P(X=0)}{P(Y=0)} \\
         \qquad\qquad\qquad\quad = \frac{P(Y=0|X=0)P(X=0)}{P(Y=0|X=0)P(X=0)+P(Y=0|X=1)P(X=1)} \\
         \qquad\qquad\qquad\quad = \frac{(1-p)p_0}{(1-p)p_0 + qp_1} #]
      [# P(X=1|Y=1), P(X=0|Y=1), P(X=1|Y=0) #]도 마찬가지로 구하면 됨

New

[베이즈 통계학]1. 베이즈 통계 2. 베이즈 정리 3. 사전확률/사후확률 4. 조건부 확률 5. 우도

▷ Top (분류 펼침) : 1,592개 분류 6,520건 해설

Priori Probability, Posteriori Probability 사전 확률, 선험적 확률, 사후 확률, 후험적 확률

수정 확률, 역 확률