21 Марта, 10:37
233

Ученые Smart Engines научились распознавать рукописную “шиншиллу” из мемов про русский курсив

Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как “шиншилла”, без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями.

Слово “Шиншилла” – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы. По этой причине слово “шиншилла” неоднократно упоминалось в мемах про сложность русского языка.

Нейросетевая архитектура «Да Винчи» не использует лингвистические механизмы — рекуррентные схемы, триграммы и словари. За счет этого она работает быстрее аналогов и занимает меньше места в памяти устройства. Но даже это не гарантирует переобучения языковому контексту. Для радикального сокращения риска галлюцинаций «Да Винчи» обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв.

“Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка”, – комментирует генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

Выход новой технологии приурочен к десятилетию выпуска первой системы распознавания паспорта РФ в видеопотоке на смартфоне. 17 марта 2015 года ученые Smart Engines первыми в мире реализовали возможность распознавания страниц основного разворота паспорта на мобильном телефоне в видеопотоке в режиме реального времени. Целевыми моделями в то время были iPhone 4S и Samsung Galaxy S3.


Читайте наш канал в Telegram : узнавайте о главных новостях дня первыми.

Первая полоса