В Великом Новгороде ИИ учится читать древнерусские тексты

Чтение рукописных берестяных грамот из Древней Руси вскоре перестанет быть проблемой. Уже сейчас система искусственного интеллекта (ИИ) для распознавания древнерусских текстов, разработанная новгородскими учеными, за несколько секунд может выдать интерпретацию введенного документа. А в будущем она сможет работать не только с древней берестой, но и с рукописями.
Искусственный интеллект переведет древние берестяные грамоты на современный язык.
Искусственный интеллект переведет древние берестяные грамоты на современный язык. / Александр Овчинников

Берестяные грамоты - бесценный источник сведений о том, как жили наши предки. Среди них есть и бытовые записки, и письма к родным, и черновики документов, и долговые расписки. Однако их расшифровка очень трудоемка, и многие грамоты еще хранят тайны. Возможно, их приоткроет ИИ. "Многие символы могут иметь разные варианты прочтений, а разнообразие устаревших букв и наличие редких диакритических знаков усложняют классификацию по стандартным моделям", - поясняет автор разработки магистрант Политехнического института, ассистент кафедры информационных технологий и систем НовГУ Иван Филиппов.

Поэтому для обучения ИИ "чтению на древнерусском" использовали специальный датасет из пяти наиболее обширных и расшифрованных грамот. По мере использования программы он обогащается новыми качественными расшифровками, то есть нейросеть продолжает обучаться. "Точность распознавания высокая - после всех доработок и корректировок она составляет 98%, - уточняют разработчики. - Система уже сейчас готова к интеграции в архивные и научные проекты по изучению древнерусских грамот".