Новая система перевода: теперь смартфон понимает то, что раньше знали только египетские жрецы

От расшифровки клинописи до перевода древнеегипетских надписей — задача, казавшаяся почти невозможной, постепенно переходит в цифровую эпоху. Российские исследователи сделали шаг вперёд: специалисты из Института искусственного интеллекта AIRI, Института системного программирования им. В. П. Иванникова РАН и Университета ИТМО создали систему, способную распознавать и переводить древнеегипетские иероглифы с высокой точностью.

Разработка основана на технологиях искусственного интеллекта и машинного обучения, но её суть — в умении "понимать" контекст. В отличие от алфавитных систем, где достаточно распознать несколько десятков букв, древнеегипетское письмо состоит из сотен сложных символов, каждый из которых может иметь особое значение в зависимости от соседних знаков. Система должна не просто видеть контуры иероглифа, а интерпретировать его смысл в контексте других знаков и фрагмента текста.

Чтобы справиться с такой нагрузкой, учёные применили комбинированный подход. В основу легли контекстуальные OCR-модели, которые анализируют изображение и текст вместе, и диффузионные модели, генерирующие реалистичные изображения редких символов. Это позволило увеличить объём обучающего набора и добиться более устойчивых результатов при распознавании повреждённых надписей или плохо читаемых фрагментов папирусов.

Для обучения системы использовался Thesaurus Linguae Aegyptiae — крупнейшая в мире база древнеегипетских текстов с переводами и комментариями. На первом этапе качество перевода проверялось с помощью автоматических метрик, затем результаты оценивали профессиональные египтологи из НИУ ВШЭ. Такой подход помог не только повысить точность, но и скорректировать нюансы перевода, которые не улавливают алгоритмы.

Исследователи отмечают, что проект имеет значение не только для египтологии, но и для других областей, где требуется работа с редкими и плохо структурированными данными. Технология может стать основой для новых систем распознавания рукописных текстов и редких письменностей — от древних манускриптов до архивных документов, созданных в условиях ограниченного количества источников.

Перспективы применения уже обсуждаются. Разработчики предполагают, что подобные модели будут интегрированы в образовательные программы и цифровые сервисы. Например, с помощью мобильного приложения можно будет навести камеру смартфона на музейный артефакт и получить перевод надписи в реальном времени. Для студентов, изучающих египетский язык, система станет интерактивным помощником, который не только показывает перевод, но и объясняет грамматическую структуру.

Новая разработка помогает переосмыслить сам процесс изучения древних культур: вместо долгих часов за словарями и справочниками исследователь получает инструмент, который соединяет лингвистику, археологию и ИИ. При этом учёные подчеркивают, что система не заменяет специалистов, а лишь ускоряет рутинные этапы анализа.

"Проект стал результатом работы междисциплинарной команды специалистов по машинному обучению и египтологии. Первую научную работу, посвящённую разработке метода, мы уже представили на международной конференции SIGGRAPH 2025 … На данный момент доступ к системе открыт по запросу для заинтересованных специалистов", — сообщает пресс-служба ИСП РАН, цитируя  руководителя проекта, ведущего научного сотрудника ИСП РАН и AIRI, доцента ИТМО Илью Макарова.

Разработка показывает, как синтез искусственного интеллекта и гуманитарных наук способен оживить наследие древних цивилизаций. Если раньше дешифровка иероглифов требовала десятилетий кропотливой работы, то теперь цифровые инструменты дают возможность не просто читать тексты, но и изучать эволюцию языка, стиль письма и культурный контекст эпохи.

Автор Игорь Буккер
Игорь Буккер — журналист, очеркист