Разобрался, как устроена формула теоремы Байеса.
\[P(A|B)=\frac{P(B|A)P(A)}{P(B)}\]Представим, что есть автобусная остановка, на которой за сутки останавливается 100 автобусов, идущих по одному из маршрутов — №5 или №10. При этом по маршруту №5 идет 60 автобусов, а по маршруту №10 – 40 автобусов.
Из этой сотни автобусов 12 новые — с кондиционером, низким полом и удобными креслами: 4 автобуса на маршруте №5 и 8 — на маршруте №10 (на картинке они, для наглядности, выделены желтым).
Человек, опаздывая на работу, прибежал на остановку и, не глядя на номер маршрута, запрыгнул в подошедший автобус, при этом автобус оказался новым. Какова вероятность того, что этот автобус идет по маршруту №10?
Чтобы понять эту формулу, для начала нужно выразить общее количество новых автобусов, назовем их TNN (total number of new), через вероятность в них сесть. То есть, нужно умножить вероятность сесть в новый автобус, которая будет выражена как \(P(N)\) и равна 0.12 на общее количество маршрутов, обозначенное как TNR (total number of routes):
\[\text{TNN} = P(N)\times \text{TNR}\]если в эту формулу подставить цифры, получится:
\[\text{TNN}=0.12\cdot 100=12\]Теперь точно так же нужно выразить общее количество автобусов, идущих по маршруту №10. Обозначим это как TNR10 (total on number 10). Это будет произведение вероятности сесть в автобус №10, которая будет обозначена как \(P(10)\) и равна 0.4, и общего количества автобусов TNR:
\[\text{TNR10}=P(10)\times \text{TNR}\]подставим цифры:
\[\text{TNR10} = 0.4 \cdot 100 = 40\]Затем, выразим количество новых автобусов на маршруте №10 NNR10 (number of new on route 10) как вероятность встретить новый автобус на этом маршруте \(P(N | 10)\), умноженную на общее количество автобусов на этом маршруте TNR10:
\[\text{NNR10} = P(N|10) \times \text{TNR10}\]Если подставить в формулу цифры, получится:
\[\text{NNR10} = 0.2 \cdot 40 = 8\]Теперь посчитаем вероятность того, что новый автобус идет по маршруту №10 \(P(10 | N)\). Для этого нужно количество новых автобусов на маршруте №10 NNR10 разделить на общее количество новых автобусов TNN:
\[P(10|N)=\frac{\text{NNR10}}{\text{TNN}}\]Теперь в этой дроби числитель и знаменатель разложим так, как это делали выше:
\[P(10|N)=\frac{P(N|10)\times \text{TNR10}}{P(N)\times\text{TNR}}\]Затем в числителе разложим общее количество автобусов, идущих по маршруту №10 TNR10:
\[P(10|N)=\frac{P(N|10)\times P(10) \text{TNR}}{P(N)\times\text{TNR}}\]Сократим общее количество маршрутов TNR в числителе и знаменателе и получится формула Байеса:
\[P(10|N)=\frac{P(N|10)\times P(10) }{P(N)}\]То есть, вероятность того, что новый автобус идет по маршруту №10 равна произведению вероятности встретить новый автобус на маршруте №10 \(P(N | 10)\) и вероятности сесть в автобус №10 \(P(10)\), деленной на вероятность сесть в новый автобус на любом маршруте \(P(N)\).
Если подставить в эту формулу цифры, то получится:
\[P(10|N)=\frac{0.2\cdot0.4}{0.12}=\frac{2}{3}\]