В ходе своего выступления Владимир Арлазаров объяснил, какие именно научные разработки используются при создании систем распознавания паспорта, документов с печатным и рукописным заполнением, корпоративных документов с таблицами, банковских карт и баркодов, решений для проверки подлинности и биометрической сверки лиц. Всего во время доклада были представлены свыше двух десятков технологий.
Так, с повсеместным распространением переводов по СБП, крайне актуальна стала задача распознавания номеров телефонов. Ее ключевой особенностью является крайне креативное написание людьми различных комбинаций цифр, тире, скобочек, точек и других сепараторов. Для решения этой задачи в Smart Engines был разработан оригинальный способ комбинирования метода Виолы и Джонса и древовидной архитектуры детектирования объекта.
Для решения задачи распознавания рукописного текста в документах используются рекуррентные нейронные сети. Рукопись отличается от печатного текста усложненной геометрией, поэтому для ее распознавания используется максимум имеющейся у нас информации. На каждой итерации алгоритм «подсвечивает» текущий интересующий его символ, с учетом символов и позиций, предсказанных ранее. Таким образом, алгоритм запоминает не только визуальное представление символов, но и языковую модель.
Генеральный директор Smart Engines Владимир Арлазаров рассказал не только о технологиях сегодняшнего, но и о технологиях “завтрашнего дня” и, в частности, про 4,6-битные нейросети: “Задача эффективного исполнения нейронных сетей на конечных устройствах стала не просто актуальной, а приобрела первостепенную важность. Прямо сейчас большая часть пользовательских устройств оснащены центральными процессорами. Мировым стандартом для них является использование 8-битных нейронных сетей. Однако глубокие нейронные сети на сегодняшний день усложняются, содержат сотни миллионов коэффициентов и требуют большей вычислительной мощности. Поэтому мы предложили качественное улучшение 8-битной модели, эффективно использующее архитектурные особенности центральных процессоров мобильных устройств: 4.6-битные сети”.
Представленные на AI Journey разработки внедрены во все программные продукты компании. С их помощью сегодня в России ежемесячно считывается более 50 млн QR-кодов и банковских карт для совершения платежей, миллионы паспортов и других документов в процессах дистанционного и выездного обслуживания. Технологии Smart Engines применяют 10 из 13 системно-значимых банков РФ, в числе которых Газпромбанк, ВТБ, Альфа-Банк, МКБ, «Открытие», Росбанк, Тинькофф, Промсвязьбанк, Райффайзен Банк, Совкомбанк, а также МТС, Билайн, Мегафон, ФНС России, аэропорт Шереметьево и другие компании в России и за рубежом.