Продолжаем знакомиться с книгой Кита Йейтса.
Многие думают: «Совпадения не случайны». Это неудивительно, потому что большинство из нас, сознательно или нет, но считают, что являются центром Вселенной. Cмотрят на вещи со своей колокольни, объявляя удачу – судьбой. Даже там, где нет явной связи, ищутся и находятся знаки и смысл, например, в случае заболеваемости лейкемией в районах, прилегающих к линиям электропередач. Почему? Наверное, когда-то поспешные обобщения спасали нам жизнь. Если кто-то шумит в кустах – то это может быть хищник. Может и не быть, только лучше всё-таки дёрнуть подальше оттуда.
Смысл находим и потому, что не совсем хорошо представляем себе картину случайности. Считаете, эти птицы гнездуются в хаотичном порядке?
Нет, конечно. Им и в голову не придёт в голову усесться совсем рядом с соседом. А должны бы, если бы садились в случайном порядке.
Ну а если случайная картина напоминает что-то, то мы считаем часто, это не может быть случаем. Этот психический феномен называется апофенией. Некоторые проводят время жизни в поиске тайных сообщений, проигрывая популярные треки задом наперёд, ищут потусторонние сообщения в шуме из динамика радиоприёмника и жалуются на Джоббса, который, по их мнению, недостаточно тщательно перемешивал треки на Айподе. Пришлось тому переделывать алгоритм, чтобы не попадалось несколько треков одного и того же исполнителя подряд (хотя по канонам случайности это вполне возможно).
На самом деле, если захочешь увидеть какое-то совпадение – непременно найдёшь. Учёные, не найдя искомой корреляции в наборе данных, частенько занимаются p-hacking или подгонкой результата. Я рассказывал об этом здесь. Ищут какие-то другие корреляции. И находят их. А то, что они являются полной экзотикой и не воспроизводятся – не волнует. Главное, что можно статейку тиснуть.
В Британии, начиная с 1966 года, было организовано Бюро Предсказаний, куда можно позвонить и рассказать о приближающемся несчастье. В 1967 году некто Алан Хенчер сообщил о скором падении самолёта в горах со смертью 123 или 124 человек. На следующий день мир облетела весть о катастрофе пассажирского лайнера, попавшего в грозу над Кипром. 124 смерти. Бинго! Или нет? Начнём с того, что Кипр горами назвать трудно. Далее, ещё два человека умерло через пару дней в больнице. И закончим тем, что это был лишь один из сотен звонков, поступивших в Бюро от Хенчера. Совпадение? Вполне может быть.
С по-настоящему большими числами всяко бывает. Бывает, выигрывают в лотерею два раза подряд. Бывает, выпадают одни и те же числа два тиража подряд, как в болгарской «6 из 42» в сентябре 2009 года. При этом если в первом из них шесть номеров не угадал никто, то во втором – аж восемнадцать человек. Бывает, чо. Вписать уже выпадавшие номера в билет для следующего тиража – вполне известная стратегия. А вероятность повтора комбинации за более, чем полувековую историю болгарской лотереи составляет ни много, ни мало – 94%. Несмотря на это, болгарский министр спорта запустил расследование, которое не нашло нарушений. Что не удивляет. Не должно удивлять.
Как не должны удивлять повторяющиеся дни рождения в классе, начиная с 23 человек. Да, начиная с этого размера, вероятность того, что у кого-то с кем-то совпадёт, превысит 50%. Объясняется это значительным превышением числа возможных пар (253) таких совпадений над числом одноклассников.
У группы в полсотни человек она составит 97%. А какова она будет у четырехста? 99,99999999...? Нет, конечно. Все 100%. В году-то не бывает больше 366 дней. «Элементарно, это же принцип Дирихле», – скажет математик. «Здравый смысл!» – ответит обыватель. Когда мест в автобусе меньше, чем пассажиров, кому-то придётся стоять.
Как видим, события, которое, казалось бы, имеют весьма малые шансы случиться, происходят вокруг нас постоянно. Здесь ключевые слова: «казалось бы».
Принципом Дирихле пользуются некоторые манипуляторы, пытаясь создать иллюзию своей всеведущести. Они делают прогнозы, закрывающие все возможные варианты с тем, чтобы стереть всё несбывшееся после события. Так сделал некто fifNdhs в Твиттере в попытке «вскрыть» коррупцию в ФИФА.
Нечто похожее может произойти без манипуляций. Мы можем восхищаться устойчивостью старых зданий, простоявших столетия без видимых повреждений. Но при этом забываем, что всё неустойчивое уже давным-давно развалилось. Можем пасть жертвой рекламы какого-нибудь лекарства, ссылающегося на публикации о его успешном применении. Но забываем, что неуспешные применения вообще не публикуются. Это искажение называют парадоксом выжившего. Совет автора читателю: будьте подобны Шерлоку Холмсу, который делал выводы не только из очевидного, но и из отсутствующих свидетельств. Обращать внимание, когда собаки не лают в ночи.
Мы плохо справляемся с неопределённостью. Нам трудно заставить себя заполнить лотерейный билет так, чтобы какие-нибудь два числа шли друг за другом, хотя примерно половина тиражей содержит такие пары. Хотите создать по-настоящему случайную последовательность? Не выдумывайте ничего, а просто бросьте жребий. Лучше получится. Опытные игроки в камень-ножницы-бумагу безошибочно определяют любую стратегию и начинают бить тебя, как только отгадают её. Не проиграть им можно, лишь переключившись на чистый случай в своём выборе. Так и всюду: если мы на самом деле хотим избежать эксплуатации своей предсказуемости, то некоторую часть своего процесса принятия решения можно попытаться отдать на волю случая.
Некоторую, но не всю! В мире достаточно идиотов, принимающих все решения по броску монеты. Более разумной является смешанная стратегия, которую используют, например, индейцы на востоке Канады. Они бросают жребий, чтобы определить, куда пойти охотиться следующий раз. Случай может помочь нам и при аналитическом параличе, когда мы не можем решиться выбрать из множества альтернатив. Например, выбрать блюдо в меню ресторана. Поговорку «лучшее – враг хорошего» не просто так придумали. Порой, важнее сэкономить время и быстро определиться, чем его упустить в погоне за сомнительной выгодой.
Наше неумение понимать неопределённость можно использовать для изобличения манипуляций. Откройте свою адресную книгу, и если она достаточно велика, можете убедиться, что первой цифрой в номерах домов чаще бывает единица, за ней идёт двойка и т.д. Девятка попадается реже всех. Хоть первым подобный факт заметил американский астроном в девятнадцатом веке (он заметил, что первые страницы математических сборников таблиц всегда наиболее истрёпаны), закон получил имя Фрэнка Бенфорда, который обнаружил подобное распределение в списках бассейнов рек, значениях теплоёмкости и прочих таблицах, включая номера домов.
Казалось бы, просто забавный факт, но нет. Не забываем, что случайные данные тоже подделывают, и не всегда в благих целях. Так некто Уэйн Джеймс Нельсон обналичил как минимум 23 фальшивых чека на сумму до двух миллионов долларов. Жулик знал, что всё, что не превышает стотысячную отметку, практически не проверяется. Но его подвела жадность: слишком многие из его сумм начинались на девятку.
Можно вспомнить в этой связи более общий закон Ципфа, согласно которому частота появления какого-то слова из текста обратно пропорциональна его порядковому номеру в списке «популярности». Наиболее популярное в английских текстах слово „the“ попадается гораздо чаще второго по популярности „of“ и ещё гораздо чаще остальных слов.
Подобным образом разбросаны и другие феномены, например, сила толчков землетрясений в регионе. 4 февраля 1974 года после предупреждения центра землетрясений одной из провинций на северо-востоке Китая власти начали массовые эвакуации. И не зря: в 19:46 случился толчок магнитудой в 7,5 баллов. Сотни тысяч жизней оказались спасены. Китай с гордостью заявил на весь мир об успехах своих сейсмологов. Вот только успехи эти оказались ограничены. Пару лет спустя в соседней провинции случилось ещё одно землетрясение силой в 7,6 баллов. 242 тысячи погибших. Никто не смог предсказать. На что же опирались предсказатели в 1974 году? На правило из старой рукописи, гласившее: «избыток дождя осенью непременно приведёт к землетрясению зимой». Если учесть, что 4 февраля – последний день зимы по китайскому календарю, а также пятибалльный форшок утром того же дня, то нетрудно понять логику китайского сейсмолога, забившего тревогу. Ему повезло. Но всё же он не был так уж неправ в своих ожиданиях. Он мог рассчитывать на сильное землетрясение в регионе в определённый промежуток времени согласно закону Гутенберга-Рихтера. Мы по-прежнему не можем заранее знать, когда это случится, но можем оценить вероятность такого события в определённый промежуток времени. И заранее инвестировать в строительство сейсмоустойчивых зданий, например.
Неочевидность вывода может поджидать нас в, казалось бы, простых случаях. К примеру, при известном заблуждении прокурора, при котором какая-нибудь улика интерпретируется против обвиняемого на том основании, что она является естественным результатом его возможных действий. Но на самом деле она может быть результатом и действий других лиц. Пусть даже эти лица с меньшей вероятностью способны создать её, но круг их может быть так широк, что в целом такой вариант может стать более вероятным, чем тот, что предлагает прокурор. Актуальной иллюстрацией может служить недавняя пандемия коронавируса, когда все массово тестировались. Если тест оказывался позитивным, то это не значило автоматически, что тестируемый инфицирован. Ведь при невысоком уровне распространения вируса в целом и повальном тестировании гораздо выше была вероятность ложнопозитивного теста. Здесь мы входим в мир условной вероятности и формулы Байеса, по которой вероятность можно уточнить на основе новых данных.
Отсюда мораль: при выводе о возможной причине явления нужно обязательно учитывать все возможные сценарии и их вероятности. Иначе можно легко пасть жертвой предвзятости подтверждения. Необходимо собирать новые данные, крупицу за крупицей. И кто знает, может, наступит момент, когда придётся изменить своё мнение. Это нормально. Так Байес сам открыл свою формулу, практикуясь на бильярдном столе и считая шары, попавшие в один или другой угол.
Пожалуй, логичнее можно было бы называть книгу «Занимательная теория вероятности». Слишком велико желание автора набросать побольше иллюстраций из этой науки, приправив соусом из баек о мошенниках. И всё же, до сей поры какая-никакая, но связь повествования с предвидением имелась. В случае с теорией игр, о которой автор рассказывает в очередной главе, я её не увидел.