Post

[딥러닝을 위한 수학] CHAPTER 2. 확률 1부

2.1 기본 개념들

  • 확률 : 어떤 일이 일어날 가능성을 [0, 1] 사이의 수치로 표현한 것

2.1.1 표본 공간과 사건

  • 표본 공간(sample space) : 주어진 한 사건의 모든 가능한 결과(outcome)를 나타내는 이산 집합(discrete set) 또는 연속 구간(continuous range)
  • 개별 사건 : 표본 공간에서 뽑은 하나의 표본(sample)
  • 가능도(likelihood) : 어떠한 사건이 일어날 가능성이 어느 정도인지를 나타내는 값

2.1.2 확률 변수

  • 확률 변수(random variable) : 해당 표본 공간에서 하나의 값을 특정한 확률로 취하는 변수
    • 이산 확률 변수(discrete random variable) : 표본 공간이 이산적인 경우, $X$로 표기함
    • 연속 확률 변수(continuous random variable) : 표본 공간이 연속적인 경우, $x$로 표기함

2.1.3 인간은 확률에 약하다

2.1.3.1 몬티 홀 딜레마

  • 세 문 중 하나에만 자동차가 존재함
  • 참가자가 세 문 중 하나를 고르면, 몬티 홀은 자동차가 없고 참가자가 고르지 않은 두 문 중 하나를 염 → 문을 바꾸는게 이득, 안 바꾸는게 이득?
    • 문을 바꾸지 않는다면, 차를 얻을 확률은 1/3
    • 문을 바꾼다면, 차를 얻을 확률은 2/3

2.1.3.2 암 진단

  • 유방조영상 사진 진단 결과가 양성인 40대 여성이 실제로 유방암을 가지고 있을 확률
  • 세 가지 정보가 주어져 있음
    • 무작위로 선택한 40대 여성의 유방함 보유 확률은 0.8%(1000명 중 8명)
    • 유방암이 있는 여성의 유방조영상 진단이 양성일 확률은 90%
    • 유방암이 없는 여성의 유방조영상 진단이 양성일 확률은 7%
  • 8 * 0.9 = 7.2, 992 * 0.07 = 69.4, 즉 유방조영상 진단이 양성인 여성은 76명
  • 따라서, 유방조영상 진단이 양성일 때 실제로 유방암이 있을 확률은 7/76 = 0.092

2.2 확률의 법칙들

2.2.1 단일 사건의 확률

  • 표본 공간의 임의의 사건 $A$에 대해

    \[0 \leq P(A) \leq 1\]
  • 표본 공간의 모든 사건 $A_i$에 대해

    \[\sum_i{P(A_i)} = 1\]
  • 사건 $A$가 발생할 확률이 $P(A)$라고 할 때, 그 사건이 발생하지 않을 확률

    \[P(\bar{A}) = 1 - P(A)\]

2.2.2 합의 법칙

  • 상호 배반(mutually exclusive) : 하나가 발생하면 다른 하나는 발생하지 않을 때
  • 합의 법칙(sum rule) : 둘 이상의 상호 배반 사건들에 대해, 두 사건 중 하나라도 발생할 확률

    \[P(A \cup B) = P(A) + P(B)\]

2.2.3 곱의 법칙

  • 곱의 법칙(product rule) : A 그리고 B가 발생할 확률

    \[P(A \cap B) = P(A)P(B)\]
    • 위 식은 서로 독립인 사건들에 적용되는 법칙이라는 것을 유의

2.2.4 합의 법칙 보충

  • 사건들이 상호 배반이 아닌 경우

    \[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

2.2.5 생일 역설

  • 한 방에 있는 사람 중 생일이 같은 사람이 적어도 두 명일 확률이 50%를 넘으려면 방에 최소 몇 명의 사람이 있어야 하는지
    • 그 어떤 쌍도 생일이 같지 않을 확률이 50% 미만이려면 방에 몇 명이 있어야 하느냐는 관점에서 접근
  • n개의 쌍이 모두 생일이 다를 확률

    \[P(\text{모두 생일이 다름}) = (\frac{364}{365})^n\]
  • n이 253 이상일 시, 적어도 한 쌍은 생일이 같을 확률이 50%를 넘으므로 필요한 사람 수는 다음과 같음

    \[\binom{23}{2} = \frac{23!}{2!(21!)} = 253\]

2.2.6 조건부 확률

  • 조건부 확률(conditional probability)
    • $P(BA)$
    • 사건 A가 발생했다고 할 때 사건 B의 확률
  • 두 사건이 종속인 경우 곱의 법칙

    \[P(A \cap B) = P(B|A)P(A)\]

2.2.7 전체 확률

  • 모든 분할에 관한 한 사건의 확률

    \[P(A) = \sum_i{P(A|B_i)P(B_i)}\]

2.3 결합 확률과 주변 확률

  • 결합 확률(joint probability)
    • $P(X=x,Y=y)$
    • $X$의 값이 $x$임과 동시에 $Y$의 값이 $y$일 확률
  • 주변 확률(marginal probability) : 하나 이상의 조건이 참일 확률을 그 밖의 조건들의 참, 거짓 여부는 신경 쓰지 않고 계산한 것

2.3.1 결합 확률표

  • 분할표(contingency table)

     색맹비색맹합계
    남성42456498
    여성3499502
    합계459551000
  • 결합 확률표(joint probability table)

     색맹비색맹합계
    남성0.0420.4560.498
    여성0.0030.4990.502
    합계0.0450.9551.000

2.3.2 확률의 연쇄 법칙

  • 확률 변수 $n$개의 결합 확률을 위한 연쇄법칙의 일반형

    \[P(X_n,X_{n-1},\dots,X_1) = \prod^n_{i=1}(X_i|\bigcap^{i-1}_{j=1}X_j)\]
This post is licensed under CC BY 4.0 by the author.