Теорема о бесконечной обезьяне - Infinite monkey theorem

Шимпанзе за пишущей машинкой

Теорема о бесконечной обезьяне гласит, что обезьяна, случайно нажимающая клавиши на клавиатуре пишущей машинки в течение бесконечного количества времени, почти наверняка напечатает любой заданный текст, например, полное собрание сочинений Уильяма Шекспира . Фактически, обезьяна почти наверняка наберет любой возможный конечный текст бесконечное число раз. Однако вероятность того, что обезьяны, заполнившие всю наблюдаемую Вселенную , напечатают одно законченное произведение, такое как Гамлет Шекспира , настолько мала, что вероятность того, что это произойдет в течение периода времени, на сотни тысяч порядков превышающего возраст человека. вселенная является крайне низкой (но технически не равен нулю). Эту теорему можно обобщить, чтобы заявить, что любая последовательность событий, которая имеет ненулевую вероятность возникновения, по крайней мере, пока она не произошла, почти наверняка в конечном итоге произойдет.

В этом контексте, «почти наверняка» является то есть событие математический термин происходит с вероятностью 1, и «обезьяна» не фактическая обезьяна, а метафора для абстрактного устройства , которое производит бесконечную случайную последовательность букв и символов. Одним из первых примеров использования «метафоры обезьяны» является пример французского математика Эмиля Бореля в 1913 году, но первый пример, возможно, был даже раньше.

Варианты теоремы включают несколько или даже бесконечно много машинисток, а целевой текст варьируется от всей библиотеки до одного предложения. Хорхе Луис Борхес проследил историю этой идеи от произведений Аристотеля « О порождении и коррупции» и « De Natura Deorum» («О природе богов») Цицерона , через Блеза Паскаля и Джонатана Свифта , до современных заявлений с их культовыми обезьянами и пишущими машинками. . В начале 20 века Борель и Артур Эддингтон использовали теорему, чтобы проиллюстрировать временные рамки, заложенные в основах статистической механики .

Решение

Прямое доказательство

Есть прямое доказательство этой теоремы. В качестве введения напомним, что если два события статистически независимы , то вероятность того, что оба произошли, равна произведению вероятностей того, что каждое из них произойдет независимо. Например, если вероятность дождя в Москве в определенный день в будущем составляет 0,4, а вероятность землетрясения в Сан-Франциско в любой конкретный день составляет 0,00003, то вероятность того, что оба события произойдут в один и тот же день, составляет 0,4 × 0,00003 = 0,000012 , если предположить, что они действительно независимы.

Рассмотрим вероятность набора слова банан на пишущей машинке с 50 клавишами. Предположим, что клавиши нажимаются случайным образом и независимо, что означает, что каждая клавиша имеет равные шансы быть нажата независимо от того, какие клавиши были нажаты ранее. Вероятность того, что первая напечатанная буква будет «b», равна 1/50, а вероятность того, что вторая напечатанная буква - «a», также равна 1/50 и так далее. Таким образом, вероятность того, что первые шесть букв будут написаны как банан, равна

(1/50) × (1/50) × (1/50) × (1/50) × (1/50) × (1/50) = (1/50) 6 = 1/15625000000.

Менее одного из 15 миллиардов, но не ноль.

Исходя из вышесказанного, вероятность того, что вы не наберете банан в блоке из 6 букв, равна 1 - (1/50) 6 . Поскольку каждый блок набирается независимо, шанс X n не набрать банан ни в одном из первых n блоков из 6 букв равен

По мере роста n X n становится меньше. Для n = 1 миллион X n составляет примерно 0,9999, но для n = 10 миллиардов X n составляет примерно 0,53, а для n = 100 миллиардов - примерно 0,0017. Когда n приближается к бесконечности, вероятность X n приближается к нулю; то есть, сделав n достаточно большим, можно сделать X n настолько маленьким, насколько это необходимо, и вероятность набрать банан приближается к 100%. Таким образом, вероятность появления слова банан в какой-то момент в бесконечной последовательности нажатий клавиш равна единице.

Тот же аргумент применим, если мы заменим одну обезьяну, печатающую n последовательных блоков текста, на n обезьян, каждая из которых печатает один блок (одновременно и независимо). В этом случае X n = (1 - (1/50) 6 ) n - это вероятность того, что ни одна из первых n обезьян не наберет банан правильно с первой попытки. Следовательно, по крайней мере одна из бесконечного множества обезьян ( с вероятностью, равной единице ) создаст текст так же быстро, как если бы он был создан совершенно точной машинисткой, копирующей его с оригинала.

Бесконечные струны

Это можно сформулировать более широко и компактно в терминах строк , которые представляют собой последовательности символов, выбранных из некоторого конечного алфавита:

  • Учитывая бесконечную строку, где каждый символ выбирается равномерно случайным образом , любая заданная конечная строка почти наверняка встречается как подстрока в некоторой позиции.
  • Учитывая бесконечную последовательность бесконечных строк, где каждый символ каждой строки выбирается равномерно случайным образом, любая заданная конечная строка почти наверняка встречается как префикс одной из этих строк.

Оба они легко следуют из второй леммы Бореля – Кантелли . Для второй теоремы пусть E k будет событием , когда k- я строка начинается с данного текста. Поскольку это имеет некоторую фиксированную ненулевую вероятность появления p , E k независимы, а приведенная ниже сумма расходится,

вероятность того, что произойдет бесконечно много E k, равна 1. Первая теорема доказывается аналогично; можно разделить случайную строку на неперекрывающиеся блоки, соответствующие размеру желаемого текста, и сделать E k событием, когда k- й блок равен желаемой строке.

Вероятности

Однако для физически значимого количества обезьян, печатающих физически значимое время, результаты меняются. Если бы обезьян было столько же, сколько атомов в наблюдаемой Вселенной, печатавших чрезвычайно быстро, в триллионы раз превышающей жизнь Вселенной, вероятность того, что обезьяны воспроизведут даже одну страницу Шекспира, непостижимо мала.

Игнорируя пунктуацию, интервалы и заглавные буквы, обезьяна, печатающая буквы равномерно наугад, имеет шанс один из 26 правильно напечатать первую букву Гамлета . Он имеет шанс один из 676 (26 × 26) напечатать первые две буквы. Поскольку вероятность уменьшается экспоненциально , для 20 букв она уже имеет шанс только один из 26 20 = 19 928 148 895 209 409 152 340 197 376 (почти 2 × 10 28 ). В случае всего текста « Гамлета» вероятности настолько исчезающе малы, что их невозможно вообразить. Текст Гамлета содержит около 130 000 букв. Таким образом, есть вероятность 1 из 3,4 × 10 183 946, чтобы получить текст правильно при первом испытании. Среднее количество букв, которые необходимо набрать до появления текста, также составляет 3,4 × 10 183 946 , или, включая знаки препинания, 4,4 × 10 360 783 .

Даже если бы каждый протон в наблюдаемой Вселенной был обезьяной с пишущей машинкой, печатавшей от Большого взрыва до конца Вселенной (когда протоны могли бы уже не существовать ), им все равно потребовалось бы гораздо большее количество времени - более трехсот и на шестьдесят тысяч порядков больше - шанс на успех равен хотя бы 1 из 10 500 . Другими словами, для шанса на успех один на триллион необходимо иметь 10 360 641 наблюдаемую вселенную, состоящую из протонных обезьян. Как написали Киттель и Кремер в своем учебнике по термодинамике , области, статистические основы которой послужили причиной первых известных описаний набора обезьян: «Вероятность Гамлета , следовательно, равна нулю в любом операциональном смысле события ...», и утверждение, что обезьяны должны в конечном итоге добиться успеха «дает неверный вывод об очень, очень большом количестве».

На самом деле вероятность успеха в такой вселенной, состоящей из обезьян, составляет менее одного триллиона, и он может напечатать любой конкретный документ длиной всего 79 символов.

Почти наверняка

Вероятность того, что бесконечная случайно сгенерированная строка текста будет содержать конкретную конечную подстроку, равна 1. Однако это не означает, что отсутствие подстроки «невозможно», несмотря на то, что априорная вероятность отсутствия равна 0. Например, бессмертная обезьяна могла бы произвольно набирайте G в качестве первой буквы, G в качестве второй и G в качестве каждой отдельной буквы после этого, создавая бесконечную строку G; ни в коем случае обезьяну нельзя «заставлять» печатать что-либо еще. (Предположение об обратном подразумевает ошибку игрока .) Какой бы длины ни была случайно сгенерированная конечная строка, существует небольшая, но ненулевая вероятность того, что она окажется состоящей из одного и того же символа, повторяющегося на всем протяжении; этот шанс приближается к нулю, когда длина струны приближается к бесконечности. В такой монотонной последовательности нет ничего особенного, за исключением того, что ее легко описать; тот же факт применяется к любой именуемой конкретной последовательности, такой как «RGRGRG», повторяющейся вечно, или «ab-aa-bb-aaa-bbb -...», или «Три, Шесть, Девять, Двенадцать…».

Если у гипотетической обезьяны есть пишущая машинка с 90 одинаково вероятными клавишами, которые включают цифры и знаки препинания, то первые набранные клавиши могут быть «3,14» (первые три цифры числа пи ) с вероятностью (1/90) 4 , что равно 1 / 65 610 000. Столь же вероятна любая другая строка из четырех символов, разрешенная пишущей машинкой, например «GGGG», «mATh» или «q% 8e». Вероятность того, что 100 случайно набранных ключей будут состоять из первых 99 цифр числа Пи (включая ключ-разделитель) или любой другой конкретной последовательности такой длины, намного ниже: (1/90) 100 . Если отведенная обезьяне длина текста бесконечна, вероятность набрать только цифры числа Пи равна 0, что так же возможно (математически вероятно), как и набрать ничего, кроме G (также вероятность 0).

То же самое относится и к случаю, когда вы печатаете конкретную версию Гамлета, за которой следуют бесконечные копии самого себя; или Гамлет, сразу за которым следуют все цифры числа пи; эти конкретные строки одинаково бесконечная длиной, они не запрещены по условиям задачи мысли, и каждый из них имеет априорную вероятность 0. В самом деле, любая конкретная бесконечная последовательность бессмертных типов обезьяны будет имели предшествующую вероятность 0 , даже если обезьяна должна что-то напечатать.

Это расширение принципа, согласно которому конечная строка случайного текста имеет все меньшую и меньшую вероятность того, что она является конкретной строкой, чем она длиннее (хотя все конкретные строки одинаково маловероятны). Эта вероятность приближается к 0, когда строка приближается к бесконечности. Таким образом, вероятность того, что обезьяна наберет бесконечно длинную строку, такую ​​как все цифры числа Пи по порядку, на клавиатуре с 90 клавишами равна (1/90) ∞, что равно (1 / ∞), что по существу равно 0. При в то же время вероятность того, что последовательность содержит конкретную подпоследовательность (такую ​​как слово ОБЕЗЬЯНА, или цифры с 12-й по 999-е числа пи, или версия Библии короля Иакова), увеличивается по мере увеличения общей строки. Эта вероятность приближается к 1, когда общая строка приближается к бесконечности, и, таким образом, исходная теорема верна.

Соответствие строк и чисел

Для упрощения мысленного эксперимента обезьяна могла бы иметь пишущую машинку всего с двумя клавишами: 1 и 0. Полученная таким образом бесконечно длинная строка будет соответствовать двоичным цифрам определенного действительного числа от 0 до 1. Счетно бесконечное множество возможные строки заканчиваются бесконечным повторением, что означает, что соответствующее действительное число является рациональным . Примеры включают строки, соответствующие одной трети (010101 ...), пяти шестым (11010101 ...) и пяти восьмым (1010000 ...). Только подмножество таких строк с действительными числами (хотя и счетное бесконечное подмножество) содержит всю полноту Гамлета (при условии, что текст подвергается числовому кодированию, например ASCII ).

Между тем существует бесчисленное множество строк, которые не заканчиваются таким повторением; они соответствуют иррациональным числам . Их можно разделить на два бесчисленно бесконечных подмножества: те, которые содержат Гамлета, и те, которые не содержат . Однако «наибольшим» подмножеством всех действительных чисел являются те, которые не только содержат Гамлета , но и содержат все остальные возможные строки любой длины и с равным распределением таких строк. Эти иррациональные числа называются нормальными . Поскольку почти все числа нормальные, почти все возможные строки содержат все возможные конечные подстроки. Следовательно, вероятность того, что обезьяна наберет нормальное число, равна 1. Те ​​же принципы применяются независимо от количества ключей, из которых обезьяна может выбрать; 90-клавишную клавиатуру можно рассматривать как генератор чисел, записанных с основанием 90.

История

Статистическая механика

В одной из форм, в которой вероятностники теперь знают эту теорему, с ее «дактилографическими» (т . Е. Пишущими на машинке) обезьянами ( французское : singes dactylographes ; французское слово singe охватывает как обезьян, так и обезьян), появилась в книге Эмиля Бореля 1913 года. статью « Mécanique Statistique et Irréversibilité » ( Статистическая механика и необратимость ) и в его книге «Le Hasard» в 1914 году. Его «обезьяны» - не настоящие обезьяны; скорее, они являются метафорой воображаемого способа создания большой случайной последовательности букв. Борель сказал, что если миллион обезьян печатает по десять часов в день, то крайне маловероятно, что их производительность будет в точности равна всем книгам из самых богатых библиотек мира; и все же, для сравнения, еще более маловероятно, что законы статистической механики когда-либо будут нарушены, даже кратковременно.

Физик Артур Эддингтон обратился к образу Бореля в своей работе «Природа физического мира» (1928), написав:

Если я позволю своим пальцам лениво бродить по клавишам пишущей машинки, может случиться так, что моя стяжка сделает внятное предложение. Если бы армия обезьян играла на пишущих машинках, они могли бы написать все книги в Британском музее. Вероятность того, что они это сделают, определенно более благоприятна, чем вероятность того, что молекулы вернутся в одну половину сосуда.

Эти изображения предлагают читателю задуматься о невероятной невероятности большого, но конечного числа обезьян, работающих в течение большого, но конечного количества времени, производя значительную работу, и сравнить это с еще большей невероятностью некоторых физических событий. Любой физический процесс, который даже менее вероятен, чем успех таких обезьян, фактически невозможен, и можно с уверенностью сказать, что такого процесса никогда не будет. Из контекста ясно, что Эддингтон не предполагает, что вероятность этого события заслуживает серьезного рассмотрения. Напротив, это была риторическая иллюстрация того факта, что ниже определенного уровня вероятности термин « невероятное» функционально эквивалентен « невозможному» .

Происхождение и «Общая библиотека»

В 1939 эссе под названием «Общая библиотека», аргентинский писатель Хорхе Луис Борхес прослеживает бесконечномерную обезьяну концепции назад к Аристотелю «s метафизики. Объясняя взгляды Левкиппа , который считал, что мир возник благодаря случайному сочетанию атомов, Аристотель отмечает, что сами атомы однородны, а их возможное расположение отличается только по форме, положению и порядку. В книге «О порождении и порче» греческий философ сравнивает это с тем, как трагедия и комедия состоят из одних и тех же «атомов», то есть буквенных символов. Три столетия спустя Цицерон «s De Natura Deorum ( О природе богов ) выступала против атомистического мировоззрения:

Тот , кто считает , что это также может полагать , что если большая величина из одной двадцати букв, состоит либо из золота или любого другого вещества, были брошены на землю, они попали бы в такой порядок , как разборчиво , чтобы сформировать Annals из Энний. Я сомневаюсь, что фортуна могла составить из них хоть один куплет.

Борхес прослеживает историю этого аргумента через Блеза Паскаля и Джонатана Свифта , а затем отмечает, что в его время словарный запас изменился. К 1939 году идиома заключалась в том, что «полдюжины обезьян, снабженных пишущими машинками, через несколько вечностей произведут все книги в Британском музее». (К чему Борхес добавляет: «Строго говоря, достаточно было бы одной бессмертной обезьяны».) Затем Борхес представляет себе содержимое полной библиотеки, которую это предприятие могло бы произвести, если довести его до крайности:

Все было бы в слепых томах. Все: подробная история будущего, Эсхила " Египтяне , точное число раз , что воды Ганга отражали полет сокола, тайну и истинную природу Рима, энциклопедия Новалис построили бы, мои мечты и сводные сны на рассвете 14 августа 1934 года, доказательство Пьера Ферма «s теоремы , неписаные главы Эдвина Друда , та же главы в перевод на язык , на котором говорят гараманты , парадоксы Беркли изобрели относительно время , но не сделали опубликовать железные книги Уризена, преждевременные прозрения Стефана Дедала , которые не имели бы смысла перед тысячелетним циклом, гностическое Евангелие Василида , песню, которую пели сирены, полный каталог библиотеки, доказательство неточности этого каталога. Все: но на каждую разумную строчку или точный факт приходятся миллионы бессмысленных какофоний, словесных фарраго и лепет. Все: но все поколения человечества могли пройти, прежде чем головокружительные полки - полки, которые стирают день и на которых лежит хаос - когда-либо вознаградят их сносной страницей.

Общая концепция библиотеки Борхеса была главной темой его широко читаемого рассказа 1941 года « Вавилонская библиотека », в котором описывается невообразимо обширная библиотека, состоящая из переплетенных шестиугольных камер, содержащих все возможные тома, которые можно составить из букв алфавита. и некоторые знаки препинания.

Настоящие обезьяны

В 2002 году преподаватели и студенты курса MediaLab Arts Университета Плимута использовали грант в размере 2000 фунтов стерлингов от Совета по делам искусств для изучения литературных произведений настоящих обезьян. Они оставили на клавиатуру компьютера в корпусе из шести Сулавесих хохлатой макак в Пейтоне в Девоне, Англия в течение месяца, с радиоканалом , чтобы транслировать результаты на сайте.

Мало того, что обезьяны не напечатали ничего, кроме пяти страниц, состоящих в основном из буквы «S», главный самец начал бить камнем по клавиатуре, а другие обезьяны пачкали ее. Майк Филлипс, директор университетского института цифровых искусств и технологий (i-DAT), сказал, что финансируемый художниками проект был в первую очередь перформансом, и они многому научились на нем. Он пришел к выводу, что обезьяны «не являются генераторами случайных чисел. Они более сложны, чем это ... Их очень интересовал экран, и они видели, что, когда они печатали букву, что-то происходило. Там был уровень намерения. "

Полный текст, созданный обезьянами, доступен для чтения «здесь» (PDF) . Архивировано из оригинального (PDF) 18 марта 2009 года.

Заявления и критика

Эволюция

Томасу Хаксли иногда ошибочно приписывают предложенный вариант теории в его дебатах с Сэмюэлем Уилберфорсом .

В своей книге 1931 года «Таинственная вселенная » соперник Эддингтона Джеймс Джинс приписал притчу об обезьяне «Хаксли», предположительно имея в виду Томаса Генри Хаксли . Эта атрибуция неверна. Сегодня иногда также сообщается, что Хаксли применил этот пример в ставших легендарными дебатах по поводу книги Чарльза Дарвина « О происхождении видов» с англиканским епископом Оксфорда Сэмюэлем Уилберфорсом на встрече Британской ассоциации содействия развитию Science в Оксфорде 30 июня 1860 года. Эта история страдает не только отсутствием доказательств, но и тем фактом, что в 1860 году пишущая машинка еще не появилась.

Несмотря на первоначальную путаницу, аргументы «обезьяна и пишущая машинка» теперь стали обычным явлением в спорах об эволюции. В качестве примера христианской апологетики Дуг Пауэлл утверждал, что даже если обезьяна случайно наберет буквы Гамлета , она не смогла произвести Гамлета, потому что у нее не было намерения общаться. Его параллельный вывод заключается в том, что законы природы не могут создавать информационное содержание ДНК . Более распространенный аргумент представлен преподобным Джоном Ф. Макартуром , который утверждал, что генетические мутации, необходимые для образования ленточного червя из амебы, столь же маловероятны, как обезьяна, печатающая монолог Гамлета, и, следовательно, шансы против эволюции всей жизни невозможны. превосходить.

Эволюционный биолог Ричард Докинз использует концепцию типирующей обезьяны в своей книге «Слепой часовщик», чтобы продемонстрировать способность естественного отбора создавать биологическую сложность из случайных мутаций . В имитационном эксперименте Докинз использует свою программу-ласку для создания фразы Гамлета METHINKS IT IS LIKE A WEASEL , начиная с произвольно типизированного родителя, путем «скрещивания» последующих поколений и всегда выбирая наиболее близкое соответствие из потомства, которое является копией родителя, со случайным образом. мутации. Вероятность появления целевой фразы за один шаг чрезвычайно мала, но Докинз показал, что она может быть произведена быстро (примерно за 40 поколений) с помощью кумулятивного отбора фраз. Случайный выбор дает сырье, а совокупный выбор дает информацию. Однако, как признает Докинз, программа ласки - несовершенная аналогия эволюции, поскольку фразы «потомство» отбирались «по критерию сходства с далекой идеальной целью». Напротив, утверждает Докинз, эволюция не имеет долгосрочных планов и не продвигается к какой-то отдаленной цели (например, к людям). Программа ласки вместо этого предназначена для иллюстрации разницы между неслучайным кумулятивным отбором и случайным одношаговым отбором. В терминах аналогии с типографской обезьяной это означает, что Ромео и Джульетта могут быть произведены относительно быстро, если их поместить в ограничения неслучайного выбора дарвиновского типа, потому что функция приспособленности будет иметь тенденцию сохранять на месте любые буквы, которые случайно совпадают с целью. текст, улучшая каждое последующее поколение печатающих обезьян.

Другой путь исследования аналогии между эволюцией и неограниченной обезьяной заключается в том, что обезьяна печатает только одну букву за раз, независимо от других букв. Хью Петри утверждает, что требуется более сложная установка, в его случае не для биологической эволюции, а для эволюции идей:

Чтобы получить правильную аналогию, нам пришлось бы оснастить обезьяну более сложной пишущей машинкой. Он должен был включать в себя целые елизаветинские предложения и мысли. Он должен был включать в себя елизаветинские представления о моделях и причинах человеческих действий, елизаветинскую мораль и науку, а также языковые образцы для их выражения. Вероятно, даже придется включить отчет о тех переживаниях, которые сформировали структуру верований Шекспира как особый пример елизаветинской эпохи. Тогда, возможно, мы могли бы позволить обезьяне играть с такой пишущей машинкой и создавать варианты, но невозможность получить шекспировскую пьесу уже не очевидна. То, что разнообразно, действительно включает в себя большой объем уже достигнутых знаний.

Джеймс В. Валентайн , признавая, что задача классической обезьяны невыполнима, обнаруживает, что существует ценная аналогия между письменным английским языком и геномом многоклеточных животных в другом смысле: оба имеют «комбинаторные, иерархические структуры», которые сильно ограничивают огромное количество комбинаций. на уровне алфавита.

Литературная теория

Р.Г. Коллингвуд в 1938 году утверждал, что искусство не может быть произведено случайно, и в саркастической шутке написал своим критикам:

... некоторые ... отвергли это предположение, указав, что если обезьяна играет с пишущей машинкой ... она напечатает ... полный текст Шекспира. Любой читатель, которому нечего делать, может развлечься, посчитав, сколько времени потребуется, чтобы на вероятность того, что на него стоит делать ставку. Но интерес предложения заключается в раскрытии психического состояния человека, который может идентифицировать «произведения» Шекспира по серии букв, напечатанных на страницах книги ...

Нельсон Гудман занял противоположную позицию, иллюстрируя свою точку зрения вместе с Кэтрин Элджин на примере Борхеса « Пьер Менар, автор« Дон Кихота »,

То, что написал Менар, - это просто еще одна надпись из текста. Любой из нас может сделать то же самое, что и печатные машины и копировальные аппараты. В самом деле, нам говорят, если бесконечно много обезьян ... одна в конечном итоге создаст точную копию текста. Эта копия, как мы утверждаем, будет таким же экземпляром произведения « Дон Кихот» , как рукопись Сервантеса, рукопись Менара и каждый экземпляр книги, который когда-либо был или будет напечатан.

В другом сочинении Гудман уточняет: «То, что обезьяна, возможно, произвольно произвела свою копию, не имеет никакого значения. Это один и тот же текст, и он открыт для всех тех же интерпретаций ...» Жерар Женетт отвергает аргумент Гудмана как напрашивается вопрос .

Для Хорхе Дж. Э. Грасиа вопрос об идентичности текстов приводит к другому вопросу, а именно об авторе. Если обезьяна способна печатать Гамлета , несмотря на то, что не имеет смысла и, следовательно, дисквалифицирует себя как автор, то оказывается, что тексты не требуют авторов. Возможные решения включают в себя утверждение, что тот, кто находит текст и идентифицирует его как Гамлета, является автором; или что Шекспир - автор, обезьяна - его агент, а нашедший - просто пользователь текста. У этих решений есть свои трудности, поскольку кажется, что текст имеет значение отдельно от других агентов: что, если обезьяна действует до рождения Шекспира, или если Шекспир никогда не родился, или если никто никогда не находит машинописный текст обезьяны?

Генерация случайных документов

Теорема касается мысленного эксперимента, который не может быть полностью осуществлен на практике, поскольку предсказывается, что он потребует непомерно много времени и ресурсов. Тем не менее, он вдохновил на создание конечного случайного текста.

Одна компьютерная программа Дэна Оливера из Скоттсдейла, штат Аризона, согласно статье в The New Yorker , дала результат 4 августа 2004 года: после того, как группа проработала 42 162 500 000 миллиардов миллиардов обезьяньих лет, одна из «обезьян» напечатано "ВАЛЕНТИНА. Прекратить toIdor: eFLP0FRjWK78aXzVOwm) - '; 8.t«Первые 19 букв этой последовательности можно найти в« Двух джентльменах из Вероны ». Другие команды воспроизвели 18 персонажей из« Тимона Афинского », 17 из« Троила и Крессиды »и 16 из« Ричарда II ».

Веб-сайт под названием The Monkey Shakespeare Simulator , запущенный 1 июля 2003 года, содержал Java-апплет , имитирующий большую популяцию обезьян, печатающих произвольно, с заявленным намерением увидеть, сколько времени потребуется виртуальным обезьянам, чтобы создать полную пьесу Шекспира от начала до конец. Например, он произвел эту частичную строку из Генриха IV, часть 2 , сообщая, что потребовалось «2,737,850 миллионов миллиардов миллиардов миллиардов обезьяньих лет», чтобы найти 24 совпадающих символа:

СЛУХ. Открой свои глаза; 9r "5j5 &? OWTY Z0d

Из-за ограничений вычислительной мощности программа использовала вероятностную модель (с использованием генератора случайных чисел или ГСЧ) вместо фактического создания случайного текста и сравнения его с Шекспиром. Когда имитатор «обнаружил совпадение» (то есть, ГСЧ сгенерировал определенное значение или значение в определенном диапазоне), имитатор имитировал совпадение, генерируя согласованный текст.

На практике для генерации естественного языка используются более сложные методы . Если вместо того, чтобы просто генерировать случайные символы, вы ограничиваете генератор осмысленным словарем и консервативно следуя правилам грамматики, например, используя контекстно-свободную грамматику , то случайный документ, сгенерированный таким образом, может даже обмануть некоторых людей (по крайней мере, при беглом чтении), поскольку показано в экспериментах с SCIgen , snarXiv и Генератором постмодернизма .

В феврале 2019 года OpenAI группа опубликовала Generative Предварительно подготовленные Transformer 2 (GPT-2) искусственный интеллект в GitHub , который способен производить полностью правдоподобную новость получила два входа предложений из человеческой руки. ИИ был настолько эффективен, что вместо публикации полного кода группа решила опубликовать сокращенную версию и выпустила заявление, касающееся «опасений по поводу использования больших языковых моделей для создания обманных, предвзятых или оскорбительных формулировок в больших масштабах».

Тестирование генераторов случайных чисел

Вопросы о статистике, описывающей, как часто идеальная обезьяна должна вводить определенные строки, превращаются в практические тесты для генераторов случайных чисел ; они варьируются от простых до «довольно сложных». Компьютерные науки профессор Джордж Marsaglia и Ариф Zaman сообщает , что они привыкли называть одну такую категорией тестов «перекрывающимися т- кортежей тестов» на лекциях, так как они относятся к перекрывающимся м-кортежи последовательных элементов в случайной последовательности. Но они обнаружили, что их название «тесты на обезьянах» помогло студентам мотивировать эту идею. В 1993 году они опубликовали отчет о классе тестов и их результатах для различных ГСЧ.

В популярной культуре

Теорема бесконечной обезьяны и связанные с ней образы считаются популярной и пресловутой иллюстрацией математики вероятности, широко известной широкой публике из-за ее передачи через массовую культуру, а не через формальное образование. Этому помогает врожденный юмор, возникающий из образа буквальных обезьян, гремящих по пишущей машинке, и это популярная визуальная шутка.

Цитата, приписываемая выступлению Роберта Виленски в 1996 году, гласила: «Мы слышали, что миллион обезьян за миллионом клавиатур могут создать полное собрание сочинений Шекспира; теперь, благодаря Интернету, мы знаем, что это неправда».

Неизменная и широко распространенная популярность теоремы была отмечена во введении к статье 2001 года «Обезьяны, пишущие машинки и сети: Интернет в свете теории случайного превосходства». В 2002 году в статье в The Washington Post говорилось: «Множество людей повеселились со знаменитым представлением о том, что бесконечное количество обезьян с бесконечным количеством пишущих машинок и бесконечным количеством времени может в конечном итоге написать произведения Шекспира». В 2003 году ранее упомянутый эксперимент, финансируемый Советом по делам искусств с участием настоящих обезьян и компьютерной клавиатуры, получил широкое освещение в прессе. В 2007 году теорема была внесена журналом Wired в список из восьми классических мысленных экспериментов .

В короткой одноактной пьесе американского драматурга Дэвида Айвса « Слова, слова, слова» из сборника « Все в срок» высмеивается концепция теоремы о бесконечной обезьяне.

Смотрите также

Примечания

использованная литература

внешние ссылки