Все мы начиная с 24 февраля 2022 года оказались перед лицом наступающего варварства, насилия и лжи. В этой ситуации чрезвычайно важно сохранить хотя бы остатки культуры и поддержать ценности гуманизма — в том числе ради будущего России. Поэтому редакция «Горького» продолжит говорить о книгах, напоминая нашим читателям, что в мире остается место мысли и вымыслу.
Джонджо Макфадден. Жизнь проста. Как бритва Оккама освободила науку и стала ключом к познанию тайн Вселенной. М.: КоЛибри, Азбука-Аттикус, 2023. Перевод с английского И. В. Никитиной. Содержание
В апреле 1761 года, спустя 34 года после смерти Исаака Ньютона и за 118 лет до того, как родился Альберт Эйнштейн, протестантский священник-нонконформист, философ-моралист и математик Ричард Прайс (1723–1791) разбирал бумаги своего недавно скончавшегося друга, математика Томаса Байеса (1702–1761). Репутация Байеса как ученого была довольно скромной. Тридцатью годами ранее он выступил в защиту метода математического анализа Ньютона, который подвергся нападкам со стороны ирландского философа и католического епископа Джорджа Беркли. В своей статье Беркли раскритиковал Ньютона, назвав его «отступником», поскольку опасался, что механистические теории Ньютона могут подорвать христианскую веру. Байес в статье «Введение в проблему флюксий» (An Introduction to the Fluxions), написанной в 1736 году в ответ на критику Беркли, не только вступился за Ньютона, но и обвинил Беркли в ошибочности доводов, утверждая, что не следует использовать религию как аргумент в научном споре. Сан пресвитерианского священника не помешал Байесу заявить, что он будет «рассматривать предмет дискуссии сугубо в рамках светской науки, которая не имеет отношения к религии». Это говорит о том, что начатое Уильямом Оккамом четыре столетия назад разделение религии и науки было почти завершено, по крайней мере в физике.
Среди бумаг Байеса Прайсу попалась работа, которая одновременно заинтересовала и озадачила его. Она называлась «Очерки к решению проблемы доктрины шансов» (An Essay toward solving a Problem in the Doctrine of Chances). Воля случая, шанс или вероятность были популярной темой в XVIII веке, судя по тому, как процветало в то время страховое предпринимательство в Англии и Шотландии, являя пример обогащения, в основе которого была правильная оценка рисков смерти, болезни, кораблекрушений, ущерба, увечий и несчастных случаев. Некоторые родственники Прайса занимались страховой статистикой, и он сам через десять лет напишет книгу о статистических методах расчетов страховых тарифов. Однако в 1761 году он и понятия не имел о методах статистики, о которых говорилось в работе Байеса.
Томас Байес — один из самых загадочных героев нашего повествования. Мы знаем о нем не больше, чем об Уильяме Оккаме. Часто встречающийся портрет, на котором изображен темноволосый господин строгого вида в облачении пресвитерианского священника, принято считать портретом Байеса, однако никто не может поручиться за достоверность этой информации. Он родился в 1702 году, предположительно в Хартфордшире, в семье пресвитерианского священника Джошуа Байеса. Получив образование в Эдинбургском университете, где он изучал богословие и логику, он пошел по стопам отца и стал священником церкви Маунт-Сайон в городке Танбридж-Уэллс в графстве Кент. В эпоху Реставрации, после того как в 1663 году король Карл II со своей супругой посетил город, чтобы «отведать целебной минеральной воды» из источников, окружавших город, это место стало одним из самых популярных английских курортов. Однако с тех пор город приобрел скандальную репутацию. Джон Уилмот, граф Рочестер, в сатире «В долгу у удовольствий» (The Debt to Pleasure) в 1685 году описывает его как «место, где можно встретить разного рода шутов, фигляров, болтунов и сплетников, мужей-рогоносцев, проституток, а также достойных граждан с женами и дочерями».
Преподобный Томас Байес не был особенно популярен как священник в этом «городе греха», однако его знали как человека науки, и однажды в 1740 году он даже был приглашен для публичной демонстрации опыта таяния льда перед «тремя гостями из Ост-Индии», посетившими город. В 1742 году он был принят в Лондонское королевское общество, скорее всего, благодаря своей статье в защиту методов Ньютона, однако с тех пор он больше не публиковал трудов по математике. По этой причине случайно обнаруженная работа о проблемах вероятности вызвала у Ричарда Прайса большое удивление. Через два года после смерти Байеса, благодаря стараниям Прайса, работа была зачитана на заседании Лондонского королевского общества и опубликована.
Бритва вероятности
Скорее всего, Байес впервые заинтересовался проблемой вероятности, прочитав «Трактат о человеческой природе» шотландского философа Дэвида Юма. Юм усомнился в обоснованности индуктивного метода, доминировавшего в науке с начала эпохи Просвещения, и сформулировал философскую проблему, которая стала известна как проблема обоснования индукции. Как упоминается в главе 10, идея использования метода индукции для получения научно обоснованных результатов на основании серии наблюдений принадлежала Фрэнсису Бэкону. Например, наблюдая за тем, что Солнце встает каждое утро на протяжении всей истории человечества, мы можем, используя метод индукции, сделать вывод о том, что так происходит всегда. Юм отмечал, что такой вывод не подкрепляется вескими доводами. Предположение, что «поскольку Солнце всегда встает по утрам, значит, оно встанет и завтра», не более доказуемо, чем предположение, что «Солнце всегда встает по утрам, однако не взойдет завтра». Оба предположения не противоречат имеющимся данным и совпадают по логическим и эмпирическим основаниям. Юм утверждал, что выводы, сделанные на основе индуктивных умозаключений, говорят лишь о вероятности, а не об определенности.
Байес принял это утверждение Юма, однако сделал ставку на вероятность, полагая, что из нее можно извлечь пользу. Он решил проверить свою интуицию математически. Вероятно, по делам службы ему приходилось заниматься сбором благотворительных средств, а для этого ему доводилось участвовать во всевозможных лотереях и розыгрышах призов. Неслучайно он начинает свою книгу с того, что предлагает читателям «представить человека, который пришел на розыгрыш лотереи, не зная, как она организована, и не представляя соотношения выигрышных и невыигрышных билетов». Здесь я предлагаю заменить лотерею на игральные кости, чтобы нам было проще оценить роль бритвы Оккама в байесовской статистике. Представим, что у друга преподобного мистера Байеса, мистера Прайса, есть две игральные кости. Одна из них обычная, в виде шестигранного кубика, а другая, более сложная, имеет 60 граней. Далее представим себе, что мистер Прайс предлагает своему другу сыграть в такую игру: стоя за ширмой, он будет бросать кубик, называя выпавшее число, а мистер Байес должен угадать, какой кубик брошен.
Вероятно, поначалу интуиция преподобного Байеса подсказывает, что это может быть любой кубик. Используя современные статистические термины применительно к посмертно опубликованной работе Байеса, мы назовем эту вероятность априорной, поскольку она возникает прежде, чем мистер Прайс бросит кубик, и составляет ½ или 0,5 как для предположения в пользу шестигранного кубика, так и для предположения в пользу шестидесятигранного. Допустим, что мистер Прайс называет число 29. Байес, конечно же, говорит, что это кубик с 60 гранями, и мистер Прайс утвердительно кивает головой. Однако не стоит забывать, что Байес — математик, и во время игры он наверняка выполнил простое вычисление, следуя правилам, о которых говорится в его работе. Для шестидесятигранного кубика он умножает априорную вероятность 0,5 на значение условной вероятности, то есть вероятности того, что число 29 выпадет на этом кубике. Поскольку выпасть может любое из шестидесяти чисел, условная вероятность для каждого из них, включая число 29, составит 1/60 или 0,016. Умножив это значение на априорную вероятность 0,5, Байес получает значение апостериорной вероятности (вероятность после того, как получены данные), которая для шестидесятигранного кубика составляет 0,008.
Байес применил этот метод вычисления и при расчете аналогичной вероятности для шестигранного кубика, умножив априорную вероятность 0,5 на условную вероятность того, что выпадет число 29. В результате получился ноль, поскольку в шестиграннике нет ни одной грани, которая бы показывала число 29. Умножая любое число на ноль, мы получаем ноль, таким образом, апостериорная вероятность, что число 29 выпадет на шестигранном кубике, равна нулю. Сравнивая значения двух апостериорных вероятностей, Байес представил их как соотношение 0,008/0. Поскольку деление любого числа на ноль дает бесконечность, относительная вероятность того, что число 29 выпадет на шестидесятигранном кубике, бесконечна. А это значит, вероятность того, что Прайс бросил кубик с шестьюдесятью гранями, возрастает в бесконечное количество раз. Одно очко в пользу Байеса.
Может показаться, что в основе теоремы Байеса лежит просто здравый смысл и обычная интуиция, однако посмотрим, как сложится игра в следующем раунде. Интересно, какой кубик выберет мистер Прайс на этот раз? Итак, он снова бросает кубик и называет число 5. Ситуация становится неопределенной, поскольку это число может быть на любом из двух кубиков. Будут ли в этом случае обе гипотезы правдоподобны в равной степени? Преподобный Байес считал, что нет, и разработал собственные методы статистических вычислений для решения проблемы индукции равновероятных событий, когда две, несколько или бесконечное количество гипотез или моделей соответствуют данным наблюдений. Как в этом случае сделать правильный выбор?
Ключевым моментом в статистическом методе Байеса является принцип правдоподобия. Первым на эту идею обратил внимание Гарольд Джеффрис в книге по теории вероятностей, опубликованной в 1939 году, а в дальнейшем она получила развитие в работах других сторонников байесовской статистики. В основе байесовского подхода лежит принцип бритвы Оккама, поскольку предпочтение отдается простым моделям, а сложные отбрасываются. Мы можем легко в этом убедиться, если продолжим игру и посмотрим, как на этот раз будут соотноситься априорная и апостериорная вероятности. Байес снова исходит из того, что априорные вероятности обеих гипотез составляют 0,5. Для шестидесятигранного кубика условная вероятность, что выпадет число 5, ничем не отличается от условной вероятности, что выпадет число 29 — в обоих случаях вероятность составляет 1/60, или 0,016. Если умножить это значение на априорную вероятность, апостериорная вероятность снова составит 0,008.
Однако, если выполнить те же вычисления для шестигранного кубика, окажется, что условная вероятность, что выпадет число 5, будет значительно выше и составит 1/6 или 0,16. Это объясняется тем, что шестигранный кубик проще в том смысле, что на нем меньше чисел. Байес умножает априорную вероятность 0,5 на 0,16 и получает апостериорную вероятность 0,08. Это в 10 раз больше, чем апостериорная вероятность для шестидесятигранного кубика. Таким образом, вероятность того, что число 5 выпадет на шестигранном кубике, в десять раз превышает вероятность для шестидесятигранного кубика. Благодаря новому методу статистических вычислений Байес снова угадывает и снова побеждает в игре.
Принцип правдоподобия обеспечивает байесовскую статистику собственной встроенной бритвой, с помощью которой отсекается лишнее и остаются только простые модели с более высокой вероятностью получения результатов. Для наглядности возьмем пространство параметров, представляющее собой диапазон возможных значений для каждой модели или гипотезы, или диапазон наблюдаемых результатов, получаемых при использовании такой модели или гипотезы. В маленьком кружочке в центре находятся те числа (от 1 до 6), которые могут выпасть, если бросить шестигранный кубик, — это параметрическое пространство для шестигранного кубика. Больший по площади кружок очерчивает пространство параметров для шестидесятигранного кубика, а все остальное пространство, уходящее в бесконечность, заполнено числами, которые не могут выпасть ни на одном из них. Обратите внимание на то, что пространство параметров шестидесятигранного кубика включает меньшее пространство значений шестигранного кубика. Обведенное в кружок число 5 находится в обоих пространствах, поскольку может выпасть на любом кубике. Однако оно может выпасть и если в распоряжении мистера Прайса будет кубик с семьюдесятью гранями, восьмьюдесятью или бесконечным количеством граней. Итак, мы вновь подошли к главной проблеме науки, о которой не раз говорили на страницах этой книги, — проблеме выбора модели. При наличии множества моделей, каждая из которых объясняет интересующее нас явление, как сделать правильный выбор? Суть байесовской бритвы в том, что выбор делается в пользу той теории, гипотезы или модели, на область числовых значений которой (число 5 в нашем примере) приходится наибольшая доля пространства параметров (шестигранный кубик) и которая, таким образом, обладает наибольшей прогностической способностью. Это неизменно самая простая модель: бритва Оккама.
Заложенный в теории вероятности Байеса принцип бритвы Оккама — пример научного подхода к выбору оптимальной модели. Рассмотрим закон Ньютона, утверждающий, что «действию всегда есть равное и противоположное противодействие». Таким образом, когда вы пинаете футбольный мяч, сила удара вашего ботинка (действия) на мяч встречается с силой ответного действия (равного и противоположного противодействия) мяча на носок вашей ноги. Этому простому закону подчиняется любой удар ногой по мячу в любом футбольном матче. Однако есть и другой закон, в равной степени сопоставимый с имеющимися данными: «Действию всегда есть равное и противоположное противодействие плюс маленький невидимый демон, толкающий мяч, заставляя его прижиматься к носку вашей ноги». Найдется и третья гипотеза, в которой будет уже два демона, и четвертая, где к двум демонам присоединится ангел, и каждый участник отвечает за определенную составляющую действия мяча в ответ на силу вашего удара по мячу. Так количество моделей или гипотез будет множиться до бесконечности.
Это довольно банальный пример, однако к нему стоит присмотреться. Теория эфира, эпициклы Птолемея, флогистон, жизненная сила, «знающий дух» Генри Мора, созидательная сила Творца, магнетизм и электричество, пространство и время, гравитация и ускорение, мельчайшие неделимые порции энергии — все это примеры сложных моделей, объясняющих движущие силы Вселенной. Нельзя отказаться ни от одной из них, руководствуясь лишь логикой, однако наука требует делать выбор в пользу более простой модели, если таковая имеется. Метод Байеса дает статистические обоснования такого предпочтения и является подтверждением действия бритвы Оккама.
Все революционные прорывы в науке, совершенные Коперником, Ньютоном, Менделем, Дарвином и другими учеными, так называемые смены парадигм, по определению американского историка и философа науки Томаса Куна, связаны с отказом от более сложных моделей в пользу простых. Эти великие ученые отдавали предпочтение простым моделям, исходя из мистических, теологических, эстетических принципов или простой интуиции. Хотя принцип бритвы Оккама неоднократно подтверждался в науке, я все же полагаю, что яснее всего его сущность выражается в теории вероятности Байеса. В науке бритва Оккама отдает предпочтение простым моделям и теориям не потому, что они красивы, хотя нередко это так; не потому, что они проще для понимания, хотя, как правило, так и бывает; не потому, что допускают меньше предположений, хотя и это верно; и не потому, что они дают более точные прогнозы, хотя это всегда так; но потому, что вероятность их соответствия действительности более высока. Тем не менее важно помнить, что стремление к простым решениям — это свойство современной науки. До Уильяма Оккама поиск ответов на вопросы, как правило, сопровождался появлением дополнительных сущностей. Уильям Оккам был первым, кто стал говорить о необходимости добираться до простых решений, отражающих суть проблемы. Благодаря ему этот принцип стал основополагающим в науке и отличительным признаком ее современности.