16.04.2024 14:21
    Поделиться

    Мордовские ученые создадут русско-эрзянский онлайн-переводчик

    Русско-эрзянский онлайн-переводчик и чат-бот разрабатывают ученые Мордовского госуниверситета. В перспективе будет создана и русско-мокшанская версия. На реализацию этого проекта вуз получил грант в 8,5 миллиона рублей.

    Об этом сообщила пресс-служба МГУ им. Огарева. По данным Федерального агентства по делам национальностей (ФАДН), пока онлайн-переводчики созданы лишь для шести из 277 языков народов России: татарского, башкирского, чувашского, марийского, якутского и удмуртского. По мнению ученых, разработка такого сервиса по мордовским языкам расширит сферу их функционирования, а также поможет их сохранению и развитию в современных условиях.

    Основной инструмент для создания онлайн-переводчика - параллельные двуязычные корпуса текстов, имеющие перевод с одного языка на другой. Процесс перевода будет моделироваться с помощью нейросети.

    "В параллельном русско-эрзянском корпусе уже собраны выравненные тексты, содержащие около 50 тысяч предложений, - рассказал ректор МГУ им. Огарева Дмитрий Глушко. - В 2023-2024 годах вуз получил грант в размере 8,5 миллиона рублей на создание параллельных корпусов мордовских языков - русско-эрзянского и русско-мокшанского".

    Разработка такого онлайн-переводчика - сложная задача. Предложения для создания сервиса собраны из разных источников - это и художественные тексты, и официальные новости, научная и техническая литература, а также фразы из разговорников, учебников. Часто применяется термины, которые не употребляются в мордовских языках.

    По словам разработчика проекта - директора лаборатории интеллектуального анализа вуза Артема Андронова - уже запущен чат-бот в мессенджере Telegram для перевода с русского на эрзянский.

    "Также в режиме бета-тестирования с коллегами отрабатываем наиболее распространенные ошибки и неточности, вносим правки в модель, учитываем в следующих релизах, - пояснил ученый. - Сейчас мы начинаем сбор аудиозаписей на эрзянском языке для решения задач синтеза и распознавания речи. Кроме того, мы собираем и предложения для языковой пары русский-мокшанский, с дальнейшей реализацией такой же модели в виде чат-бота".

    Кстати

    Сегодня, 16 апреля, отмечается День мордовских языков. На сегодня численность мордвы в России составляет более 484 тысяч человек. Из них 30 процентов проживают в Мордовии, остальные расселены по всей стране - в основном, в Нижегородской, Ульяновской, Оренбургской, Самарской и Пензенской областях.

    Поделиться