Как ИИ раскрывает утерянные секреты Римской империи
data-testid=»article-title» class=»content—article-render__title-1g»>Как ИИ раскрывает утерянные секреты Римской империи6 минут6 прочтенийВчераВооружившись новыми инструментами, учёные наконец-то смогли прочитать папирусные свитки, которые долгое время считались слишком хрупкими для открытия. Этот прорыв может буквально изменить ход истории.Руководитель группы Юсеф Надер и ещё двое членов группы использовали ИИ, чтобы расшифровать 15 столбцов текста из древнего свитка, погребённого под вулканическими обломками на горе Везувий в 79 году нашей эры. Фотография Исмаила Фердоуса.Руководитель группы Юсеф Надер и ещё двое членов группы использовали ИИ, чтобы расшифровать 15 столбцов текста из древнего свитка, погребённого под вулканическими обломками на горе Везувий в 79 году нашей эры. Фотография Исмаила Фердоуса.
Весной 2023 года, когда студент колледжа по имени Люк Фарритор ехал на стажировку в SpaceX в Старбэйзе, штат Техас, его внимание привлёк подкаст. Ведущие рассказывали о соревновании с дерзкой целью: прочитать свиток возрастом 2000 лет, не разворачивая его физически. Рукопись является частью тайника с папирусными свитками, которые были погребены и обуглились во время извержения Везувия, уничтожившего римские города Помпеи и Геркуланум в 79 году нашей эры. Если бы свитки были развёрнуты вручную, они бы рассыпались на куски, уничтожив содержащееся в них послание. Участники, которые найдут способ заглянуть внутрь с помощью машинного обучения, могли бы разделить между собой призовой фонд в размере более миллиона долларов.
«Я подумал: «Ого, мне нужно поработать над этим», — говорит Фарритор, которому сейчас 22 года. — Многие вещи в этом проекте были действительно захватывающими, и самое главное — вы потенциально можете открыть новую библиотеку из древнего мира, а это очень важно».
Фарритор, специализирующийся на компьютерных науках, днём занимался космическими путешествиями, а по ночам и в выходные участвовал в «Испытании Везувия» — чем-то вроде путешествия во времени. Что же было написано на этом свитке с виллы в Геркулануме, которая, как считается, принадлежала тестю Юлия Цезаря?
Чтобы это выяснить, участникам конкурса нужно было разработать собственные программы, которые могли бы интерпретировать существующие 3D-сканы скрученного свитка и выявлять едва заметные физические изменения, чтобы обнаружить надписи на обугленном материале.
Сначала Фарритор изучил снимки компьютерной томографии участков, где чернила на основе углерода были незаметны на фоне обугленного папируса. Другой участник конкурса, который награждал денежными призами за обмен предварительными результатами, заметил «трещинки», напоминающие засохшую грязь, но которые могли указывать на наличие чернил. Поэтому Фарритор обучил модель машинного обучения распознавать текстуру трещин.
Однажды поздно вечером в субботу, когда Фарритор вернулся в университет Небраски, ему сообщили, что для участников загрузили новый фрагмент свитка. Он был на вечеринке, поэтому с помощью телефона вошёл в свой аккаунт и запустил модель ИИ для работы со свежим изображением. Через несколько часов он проверил свой телефон и увидел, что греческие буквы пи, омикрон и ро мерцают на нём сквозь тысячелетия.
«Осознав, что я только что автоматически открыл для себя три новых способа письма из Римской империи, я был очень рад, — говорит Фарритор. — Я был в восторге, все были в восторге. Я отправил это организаторам. Я отправил это своей маме».
Оказалось, что эти буквы были частью греческого слова, означающего «фиолетовый», и Фарритор стал первым человеком, который увидел слово из этого свитка, погребённого под десятками метров вулканического пепла.
Этот свиток был одним из примерно тысячи, найденных в 1700-х годах после того, как землекопы обнаружили виллу, которая находится под современным городом Эрколано. По мнению учёных, эта находка, скорее всего, была греческой библиотекой философа-эпикурейца и поэта Филодема. Но они подозревают, что в той части виллы, которую ещё предстоит раскопать, может находиться более крупная латинская библиотека. Если конкурс покажет, что учёные могут безопасно и легко читать нераспечатанные свитки, это может стимулировать поиск новых исторических материалов.
В такой коллекции могут быть утраченные шедевры греческой и римской истории, философии и литературы. Если больше свитков не будет обнаружено, «это всё равно изменит наше представление о древнем мире», — говорит Гарретт Райан, историк и подкастер, изучающий Древнюю Грецию и Рим. Но если библиотека будет найдена, это станет «настоящей революцией в классической литературе».
Но какая польза от библиотеки, если её нельзя прочитать? Первые попытки открыть хрупкие свитки привели к тому, что многие из них были повреждены, и папирологам пришлось собирать их по кусочкам. Брент Силс, профессор информатики в университете Кентукки, стал соучредителем проекта Vesuvius Challenge вместе с техническими инвесторами Нэтом Фридманом и Дэниелом Гроссом. Силс и его лаборатория проделали основополагающую работу по обнаружению чернил и цифровой распаковке, на основе которой работают конкуренты. Объявив конкурс, они, похоже, придали ему больше актуальности, объединили усилия и заручились поддержкой для такого рода неинвазивных исторических исследований.
«Фиолетовый» прорыв Фарритора был только началом. Чтобы добиться максимального прогресса, Фарритор и два других участника объединились. В начале этого года они выиграли главный приз в размере 700 000 долларов за расшифровку 15 столбцов текста из свитка, более 2000 символов. Их результат намного превзошёл первоначальную цель конкурса — расшифровать четыре отрывка по 140 символов в каждом.
Все трое использовали ИИ немного по-разному. Как и Фарритор, 28-летний лидер команды Юсеф Надер, египтянин, работающий над докторской диссертацией по искусственному интеллекту и машинному обучению в Берлине, сосредоточился на улучшении распознавания чернил. Вместо того чтобы начать с ручной проверки трещин, Надер обучил свою модель на чернилах, обнаруженных на фрагментах повреждённых свитков. Он применил модель к участкам компьютерной томографии, показывающим внутреннюю структуру целевого свитка, которую организаторы конкурса сделали, поместив свиток в луч ускорителя частиц. Процесс Надера позволил добиться более чёткой и точной прорисовки знаков.
29-летний член команды Джулиан Шиллегер, учёный-компьютерщик из Базеля, Швейцария, работал над тем, как в цифровом формате «развернуть» свиток, слои которого были видны на тысячах поперечных срезов 3D-сканирования. Отдельные слои нужно было проследить по поперечным срезам и «сплющить» в цифровом формате, что само по себе является трудоёмкой процедурой. Шиллегер разработал метод с использованием ИИ, который помог автоматизировать этот процесс. Он создал модель, которая определяла, какие точки на скане были смежными на сегментах слоёв свитка. «Это был настоящий прорыв для всех, когда стало понятно, что это можно делать автоматически», — говорит он.
Модели искусственного интеллекта, созданные Надером и Люком Фарритором, обнаружили чернильные узоры на свитках, обугленных под воздействием тепла вулканического мусора. Узоры были идентифицированы как греческие буквы, включая строку, которая составляла слово «фиолетовый». ФОТОГРАФИЯ ОТ VESUVIUS CHALLENGEМодели искусственного интеллекта, созданные Надером и Люком Фарритором, обнаружили чернильные узоры на свитках, обугленных под воздействием тепла вулканического мусора. Узоры были идентифицированы как греческие буквы, включая строку, которая составляла слово «фиолетовый». ФОТОГРАФИЯ ОТ VESUVIUS CHALLENGE
Заинтересованные папирологи установили, что обнаруженные командой столбцы являются частью размышления о наслаждении, вероятно, написанного Филодемом. В одном фрагменте говорится: «Что касается еды, мы не сразу верим, что то, чего мало, может быть приятнее того, чего в избытке».
Поскольку второй год проведения конкурса подходит к концу, организаторы поставили перед собой новые цели: прочитать 90 процентов из четырех свитков по сравнению с 5 процентами из одного свитка в 2023 году и расширить методы, впервые примененные в первый год. Повышенная автоматизация будет иметь решающее значение для чтения примерно 300 нетронутых свитков, а возможно, и еще тысяч. «Я абсолютно уверен, что эта проблема будет решена, и мы будем сканировать эти вещи, нажимать на кнопку, и 90 процентов из них просто исчезнут», — говорит Силс.
Достигнутый на данный момент прогресс воодушевил специалистов по классической литературе и заставил учёных с нетерпением ждать, что ещё могут рассказать эти найденные реликвии. «Когда нам впервые показали текст, который расшифровал ИИ, мы были в полном восторге, — говорит Роберт Фаулер, председатель Геркуланумского общества в Оксфорде, Англия, которое поддерживает сохранение виллы. — Возможность сделать это сейчас, протянуть руку через тысячелетия и заглянуть не в одну книгу, а в целую библиотеку… это связь с вечностью».