6 страница из 16
Тема
его архиве после его смерти и опубликованной в 1763 году.

Байесовский подход использует условную вероятность, чтобы работать в обратном направлении от наблюдения фактов к наиболее вероятным причинам существования этих фактов. Вспомните о монете, которую вот-вот бросит футбольный судья, чтобы решить, какая команда начнет игру. Было бы разумно думать, что существует 50 %-ная вероятность выигрыша жеребьевки любой из команд. Но что бы мы подумали, если бы знали, что в каждой из последних пяти игр с участием нашей команды и одного и того же судьи мы проигрывали жеребьевку? Мы, вероятно, заподозрим нечестные действия судьи и будем меньше верить в то, что у нас есть равные шансы выиграть жеребьевку и в этот раз. Это как раз то, что мы описываем как условную вероятность с учетом того, что теперь мы знаем результат предыдущих бросков монеты. И подобная оценка отличается от нашей предварительной оценки. В данном случае байесовский подход дарует нам научный метод, основанный на результатах прошлых бросков и приводящий нас к наиболее вероятному первоисточнику этих результатов – такому как монета со смещенным центром тяжести.

Байесовский вывод помогает нам пересмотреть степень нашей веры в вероятность того, что какое-либо суждение истинно при нашем знакомстве с подтверждающими его фактами. Этот метод применим даже тогда, когда, в отличие от примера с бросанием монеты, у нас есть только субъективное первоначальное представление о вероятной истинности предположения. Примером может служить вероятность победы нашей политической партии на следующих выборах. В данном случае таким фактом могут быть новые данные из опроса избирателей, которые заставят нас пересмотреть оценку шансов на победу. Мы можем спросить себя, насколько новые данные помогают нам различать альтернативные взгляды на ситуацию или, как мы их называем, альтернативные гипотезы о том, к чему будет близок результат выборов. Если у нас есть несколько различных вариантов, понятных нам, и факты более тесно связаны с одним из них, нежели с другими, то это заставляет нас сильнее верить в то, что это как раз и есть лучшее описание текущей ситуации.

Итак, байесовский метод рассуждения предполагает корректировку нашей предыдущей степени доверия гипотезе после получения новых фактов, что обеспечивает апостериорную степень доверия к ней («апостериорный» означает «основанный на опыте»). Ключ к этой переоценке сводится к постановке вопроса: если бы гипотеза на самом деле была верна, насколько вероятно, что мы смогли бы увидеть эти факты? Если мы считаем, что факты тесно связаны с истинностью гипотезы, то мы должны усилить наше доверие к данной гипотезе.

Аналитики из Разведывательного управления Министерства обороны США изначально считали маловероятным, что Советский Союз попытается разместить ядерные ракеты на Кубе. Эта гипотеза обладала тем, что мы называем низкой априорной вероятностью. Мы можем точно описать низкую априорную вероятность, используя систему обозначений, которые не будут лишними в следующей главе. Обозначим гипотезу о размещении ядерных ракет как N. Мы можем записать их априорную степень веры в N как априорную вероятность p(N), находящуюся в диапазоне между и 1. В данном случае, поскольку американские аналитики считали гипотезу N очень маловероятной, они могли бы присвоить p(N) значение вероятности 0,1, что означает только 10 % вероятности.

Но результаты фоторазведывательного полета ВВС США от 14 октября 1962 года заставили этих аналитиков по-иному взглянуть на ситуацию. Они узрели факты (обозначим их E), согласующиеся с детальными данными Пеньковского о процессе строительства советской стартовой позиции для ядерных ракет среднего радиуса действия. Аналитикам внезапно пришлось столкнуться с возможностью того, что Советский Союз тайно размещает на Кубе серьезный ядерный потенциал. Им нужно было найти апостериорную вероятность p(N|E) (это обозначение читается как переоцененная вероятность гипотезы N с учетом фактов E, где термин «с учетом» записан посредством вертикальной линии, |).

Факты, представленные на фотографиях, были гораздо более тесно связаны с гипотезой наличия на Кубе советских ракет с ядерными боеголовками, нежели с любой другой. Судя по фотографиям, эти объекты не были похожи на, к примеру, большие грузовики, перевозящие трубы большого диаметра для строительства. Вероятность того, что гипотеза о наличии ядерных ракет окажется верной, учитывая фотофакты ВВС США, будет пропорциональна p(E|N), то есть вероятности нахождения этих фактов в предположении, что гипотеза N верна. Эта вероятность была оценена как намного бо́льшая, чем общая вероятность того, что такие фотографии могли быть доставлены аналитикам в любом случае, – эту вероятность мы можем записать, как p(E). Связь между гипотезой о размещении ракетно-ядерного оружия и наблюдаемыми фактами, то есть отношение p(E|N) к p(E), является фактором, в котором мы нуждаемся для преобразования априорной вероятности p(N) в апостериорную вероятность, необходимую лицу, принимающему решение, то есть p(N|E).

Преподобный Байес дал нам формулу для вычисления апостериорной вероятности:

p(N|E) = p(N)×[p(E|N)/p(E)].

То есть новая вероятность того, что нечто случится (с учетом новых фактов), вычисляется путем деления того, что вы считали вероятным (до получения новых фактов), на то, насколько хорошо новые факты подтверждают утверждение о том, что могло бы случиться.

Это – единственное уравнение в данной книге[13]. Несмотря на желание выражаться как можно понятнее, я включил его, потому что оно превращает слова в точные вычисляемые условные функции правдоподобия, о которых так много говорится в современной науке о данных. В следующей главе мы рассмотрим, как можно применить великую проницательность Байеса для работы в обратном направлении, выводя из наблюдений наиболее вероятные причины того, чему мы стали свидетелями.

Пример Карибского кризиса демонстрирует байесовскую логику в действии – как обеспечить новое владение ситуацией. Например, если бы аналитики посчитали, что фотографии с тем же успехом могли изображать строительную площадку, и поэтому фотографии были верными независимо от того, было ли N истинным (то есть попали ли на них стартовые комплексы ядерных ракет), то p(E|N) было бы таким же, как p(E), и поэтому сомножитель в правиле Байеса равен единице, а апостериорная вероятность ничем не отличается от априорной. Президенту Кеннеди тогда не посоветовали бы поверить в то, что Хрущев осмелится попытаться разместить ядерные ракеты на Кубе. Если же, с другой стороны, E будет более вероятно в тех случаях, когда N истинно (на что указывала разведывательная информация Пеньковского), то это сильное доказательство того, что N действительно истинно и p(E|N) будет больше, чем p(E). Поэтому числовое значение p(N|E) сильно возрастает. Для аналитиков Пентагона p(N|E) почти наверняка было бы гораздо ближе к единице. И президенту посоветовали действовать, исходя из того, что советские ядерные ракеты находятся фактически в глубоком тылу Америки.

Ключевым элементом политическим прозорливости Кеннеди в 1962 году было признание того, что Хрущев пошел бы на такую авантюру только в том случае, если бы его убедили, что можно будет тайно установить ракеты на Кубе и оснастить их ядерными боеголовками до

Добавить цитату