
Берестяные грамоты - бесценный источник сведений о том, как жили наши предки. Среди них есть и бытовые записки, и письма к родным, и черновики документов, и долговые расписки. Однако их расшифровка очень трудоемка, и многие грамоты еще хранят тайны. Возможно, их приоткроет ИИ. "Многие символы могут иметь разные варианты прочтений, а разнообразие устаревших букв и наличие редких диакритических знаков усложняют классификацию по стандартным моделям", - поясняет автор разработки магистрант Политехнического института, ассистент кафедры информационных технологий и систем НовГУ Иван Филиппов.
Поэтому для обучения ИИ "чтению на древнерусском" использовали специальный датасет из пяти наиболее обширных и расшифрованных грамот. По мере использования программы он обогащается новыми качественными расшифровками, то есть нейросеть продолжает обучаться. "Точность распознавания высокая - после всех доработок и корректировок она составляет 98%, - уточняют разработчики. - Система уже сейчас готова к интеграции в архивные и научные проекты по изучению древнерусских грамот".