Российские ученые разработали искусственный интеллект (ИИ), который научился распознавать трудно читаемые рукописные слова, такие как "шиншилла", без использования языкового контекста. Эта инновация значительно улучшит системы распознавания документов и уменьшит вероятность появления галлюцинаций нейросетей, связанных с редко встречающимися словами, передает inbusiness.kz со ссылкой на РИА "Новости".
Главная особенность новой нейросети заключается в том, что она не использует знания о русском языке. Вместо этого ИИ анализирует исключительно особенности сопряжения букв на изображении. Это позволяет точнее распознавать такие слова, которые могут быть трудны для традиционных систем, в том числе, имена собственные или редкие слова.
Слово "шиншилла" было выбрано в качестве своеобразного теста Тьюринга для систем распознавания рукописного текста на кириллице. При неаккуратном почерке строчные буквы "ш", "л", "и" могут быть почти неразличимы, что делает распознавание особенно сложным. Именно это слово стало испытанием для новой нейросети.
Для обучения ИИ специалисты компании Smart Engines использовали 1,2 миллиона строк рукописного текста, который был синтезирован с равномерным распределением сочетаний букв. Это позволило ИИ изучить различные варианты написания и сильно снизить вероятность галлюцинаций — ошибки, когда система выдает несуществующие или неуместные слова, основываясь на данных, которых она не встречала ранее.
"Важно, чтобы ИИ не допускал галлюцинаций при анализе документов. В таких случаях точность имеет первостепенное значение, поскольку ошибки могут повлиять на результаты скоринговых моделей и другие бизнес-процессы", - подчеркнул генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.
Главная цель разработки заключалась в создании ИИ, который мог бы точно распознавать трудночитаемые рукописные слова, такие как "шиншилла", при этом не используя языковой контекст. Это особенно важно для систем, занимающихся распознаванием официальных документов, таких, как: паспорта, штампы о регистрации и другие официальные бумаги. В этих случаях нужно читать то, что написано, а не то, что правильно с точки зрения языка.
Новая нейросеть значительно улучшит работу систем распознавания документов, что, в свою очередь, окажет положительное влияние на безопасность и точность работы в таких сферах, как: банковские услуги, связь и другие отрасли, где используется распознавание текста.
Читайте по теме:
Какую проблему решил за два дня ИИ, над которой бились 10 лет ученые Великобритании