Чукотский язык готовят для интеграции в "Яндекс.Переводчик"

В Анадыре полным ходом идёт масштабная работа по созданию цифрового корпуса чукотского языка, который в будущем позволит добавить его в сервис "Яндекс.Переводчик".

Специалисты Чукотского арктического научного центра вместе с носителями языка формируют обширную базу текстов на чукотском с параллельным переводом на русский.

Как рассказал Газете "Крайний Север" директор центра
Денис Литовка, процесс состоит из нескольких этапов. Сначала оцифровывается литература, изданная в XX веке - от художественных произведений до научных трудов.

Затем в специальных таблицах текст разбивается на предложения: слева - чукотский оригинал, справа - русский перевод. Каждая такая пара называется словоформой. Изначально необходимо было собрать 300 тысяч словоформ, но для языков малочисленных народов порог снизили до 100 тысяч.

К работе привлечены известные эксперты и знатоки чукотского языка, такие как
Григорий Ранаврольтын, который лично внёс уже около 3 тысяч словоформ. Он отметил, что процесс требует особой точности: некоторые исторические тексты приходится сначала переводить с латиницы на кириллицу.

Проект планируется завершить в декабре этого года. Он реализуется при поддержке окружного Департамента образования и науки, а также Сбербанка, в рамках Международного десятилетия родных языков. Параллельно ведётся работа и над корпусом эскимосского языка, что особенно сложно из-за наличия двух диалектов, находящихся под угрозой исчезновения.
Нет комментариев