Covid-19 — самая большая проблема перевода в истории

Согласно регулярно обновляемому списку, который ведется в рамках проекта "Языки под угрозой исчезновения", информация о коронавирусе из авторитетных источников (правительства, некоммерческие организации и группы добровольцев, которые ссылаются на официальные медицинские отчеты) распространяется на более чем 500 языках. Однако в Google официально представлены около 100 языков. При этом Google как поисковик выбирают 92,04% пользователей сети (по данным за 2019 год).

Таким образом, в данной выборке (500 языков) только 20% людей могут найти то, что им нужно знать о коронавирусе. Остальные 80% вынуждены идти в больницы, нагружая и без того перегруженные системы здравоохранения. Даже если они найдут данные на английском, перевести их не выйдет — в систему Google Translate загружено около 100 языков.

Трудности перевода: ругают всех

Конечно, валить все на поисковики глупо: проблемы есть и "с другой стороны".

Так, правительство Южной Африки подвергается критике в социальных сетях за проведение брифингов в основном на английском языке, без дублирования на 10 наиболее популярных в стране языков вроде зулу, коса или сото.

А в Англии в суд попало дело, в котором истцы требовали наказать государственных служащих и СМИ за отсутствие дублирования выступлений на язык жестов (которое есть в Шотландии, Уэльсе и Ирландии).

Однако проблема столь неожиданна и масштабна, что стоит рассмотреть ее подробнее. Как вышло так, что в эпоху частной космонавтики, роботов и 5G мы не понимаем друг друга в сети?

"Это не первый такой прецедент"

Когда языковые эксперты говорят о пандемии, то вспоминают два схожих прецедента:

  • землетрясение 2010 года на Гаити
  • и эпидемию лихорадки Эбола в Западной Африке (2013 — 2016 годы) и Конго (с 2018 года).

В обоих случаях язык, на котором говорят местные жители, был неизвестен приехавших добровольцам и медикам. В случае с Гаити это привело к инициативе под названием "Миссия 4636": жители отправляли на короткий номер смс с вопросом, его быстро переводили онлайн операторы, знающие язык, а затем передавали англоязычным специалистам. Те отвечали, происходил обратный перевод — и обратившийся человек получал консультацию. В среднем отправка ответного сообщения занимала 10 минут.

Масштаб проблемы: из 7000 языков в Google есть около 109

В современном мире официально известны около 7000 языков, причем эксперты подчеркивают — число это "плавающее", то есть постоянно меняется.

Специалисты провели в Twitter эксперимент: попросили людей, знающих языки, перевести простейшую фразу "Мойте руки" через автоматический переводчик Google. Из более чем 12 представленных в итоге вариантов верными и по смыслу, и по грамматике оказались лишь 2: на корейском и суахили.

При этом цифры "известных" сайтам и поисковым системам языков ужасают:

  • Google Translate поддерживает 109 языков, Bing Translate — 71;
  • Википедия существует на 309 языках;
  • Портал переводов Translators Without Borders "знает" около 89 языков;
  • В списках проекта "Языки под угрозой исчезновения" — 500+ языков.

Кризис пандемии как никогда остро показал: мы все еще во всех смыслах говорим на разных языках. И все современные технологии, как оказалось, во многом бесполезны: что толку в доступе в Интернет на скоростях 5G, если нужных данных на нужном языке там нет?

Точно так же, как наши усилия по профилактике коронавируса складываются из небольших "кирпичиков" вроде мытья рук, самоизоляции и ношения масок, коммуникация в интернете "собирается" из усилий множества компаний и энтузиастов.

Историк и писатель Ада Палмер очень точно подметила: это первая в истории пандемия, информирование о которой было столь быстрым — даже неграмотные или "лишенные" привычного языка в соцсетях знали, что делать, благодаря графической информации вроде плакатов и рекламы в соцсетях.

Хочется верить, что в дальнейшем и крупные компании, и энтузиасты продолжат работу над тем, чтобы информация в сети была доступна на как можно большем числе языков. Суть Интернета — в глобальной коммуникации, а какая же коммуникация, если мы не понимаем друг друга?

Фото: deseret. com

Автор Евгений Стриж
Евгений Стриж — журналист, внештатный корреспондент Правды.Ру