ИИ в ЕСМ – это эффективно! Опыт ЭЛАР

Компания ЭЛАР около 27 лет занимается предоставлением услуг оцифровки, разработкой продуктов для сканирования, ведет проекты по управлению корпоративной информацией. В 2015 году у ЭЛАР появилась собственная ЕСМ-платформа «ЭЛАР Контекст», которая отвечает всем самым современным тенденциям: ее отличает мобильность, сервис-ориентированность, легкость внедрения, функциональность и, в том числе, возможность применения алгоритмов искусственного интеллекта. ИИ в ЕСМ для ЭЛАР – не дань маркетингу, а реальный способ достичь нового уровня эффективности поиска и обработки документов. Об этом рассказывает руководитель направления ЕСМ компании ЭЛАР Александр Кузнецов.

Эволюция ИИ: полвека развития и стремительный прорыв

Искусственный интеллект – это способность машины принимать какие-либо решения за человека, заниматься аналитикой, брать на себя типовые рутинные операции. Термин «искусственный интеллект» был принят на Дартмутской конференции в 1956 году. В 1964 году появился первый чат-бот ELIZA.

 

Руководитель направления ЕСМ компании ЭЛАР Александр Кузнецов

Руководитель направления ЕСМ компании ЭЛАР Александр Кузнецов

 

В 1980-х годах в приоритете оказались информатизация и распространение персональных компьютеров. Всплеск интереса к ИИ произошел в 1997 году, когда на легендарном шахматном матче всемирно известный гроссмейстер Гарри Каспаров проиграл искусственному интеллекту Deep Blue. В 2016 году ИИ-системы достигли вершины торжества: машина AlphaGO одержала победу над Ли Седолем – абсолютным чемпионом мира по игре в Го. Чемпион сделал все возможное, он провел великолепный матч, но все равно проиграл. Машина сделала невероятное – использовала не только заученные ходы, но и сумела импровизировать. Турнир доказал: ИИ можно научить думать!

 

Важнейшие этапы развития искусственного интеллекта

Важнейшие этапы развития искусственного интеллекта

 

Сегодня мы наблюдаем стремительное развитие решений на основе ИИ, которые находят применение в различных сферах: аналитика, работа с большими данными, планирование, медицина, безопасность, общественный транспорт…

ИИ сегодня: меньше хайпа, больше дела

ИТ-рынок систем управления контентом делится на две категории: технологии для решения насущных проблем и инновационные разработки в духе цифровизации. Первая категория включает электронные архивы, СЭД, отраслевые системы, которые хорошо знакомы пользователям и есть практически у каждого вендора. Вторая – это любимые маркетингом хайповые темы: искусственный интеллект, блокчейн, роботизация.

Искусственный интеллект действительно очень полезная технология для ЕСМ, но нужно отделять реальную пользу от маркетинга. Очевидно, что ИИ полезен в обработке документов. Но если мы беремся за распознавание архивных исторических или документов со слитным рукописным текстом, одного ИИ будет недостаточно. В этом случае необходим комплексный подход, в том числе с привлечением человеческих ресурсов в виде аналитиков, верификаторов и операторов индексирования.

ИИ для обработки документов и интеллектуального поиска

С нашей точки зрения для работы с контентом наиболее оптимальным выглядит применение ИИ в двух сферах: классификация и распознавание документов и интеллектуальный поиск. Оба этих направления мы активно разрабатываем и применяем в рамках нашей ЕСМ-платформы «ЭЛАР Контекст».

Исторически сложилось, что ИИ мы используем довольно давно. Компания ЭЛАР известна, как крупнейший в Европе подрядчик по оцифровке документов и исполнитель национальных проектов: «Память народа», Национальная электронная библиотека и многих других. Но мало кто знает, что различные интеллектуальные алгоритмы мы разрабатываем и применяем почти в каждом проекте уже более 15 лет, еще с того момента, когда они не были так широко распространены. Например, при выполнении работ по оцифровке ИИ помогает операторам извлекать информацию из рукописных дел: делит скан-копии на фрагменты и помечает необходимый для извлечения текст. Затем сопоставляет информацию, выявляет и исправляет расхождения. В итоге комбинация человеческого труда и искусственного интеллекта позволяет исключить ошибки индексирования и существенно облегчить работу операторов.

 

ЭЛАР использует ИИ в работе с документами уже 15 лет

ЭЛАР использует ИИ в работе с документами уже 15 лет

 

В сфере интеллектуального поиска, мы одни из первых начали применять инновационные алгоритмы дедубликации, которые позволяют в автоматическом режиме сравнивать одинаковые по смыслу и содержанию результаты в рамках одного поискового запроса и выдавать пользователю только один нужный.

 

Алгоритмы «умного поиска» отработаны компанией ЭЛАР на крупнейших проектах

Алгоритмы «умного поиска» отработаны компанией ЭЛАР на крупнейших проектах

 

ИИ в ECM-платформе «ЭЛАР Контекст»

Подобные технологии на основе ИИ мы перенесли в нашу ЕСМ-платформу «ЭЛАР Контекст», которая построена на современной сервис-ориентированной архитектуре и позволяет реализовать модульный принцип создания ИТ-решений. Благодаря чему клиенты получают только востребованный функционал без избыточных или ненужных опций и имеют возможность легко масштабировать систему с помощью покупки необходимых функциональных модулей, в том числе на базе ИИ.

 

«Умная» модульная ECM «ЭЛАР Контекст» вобрала весь опыт, накопленный ЭЛАР

«Умная» модульная ECM «ЭЛАР Контекст» вобрала весь опыт, накопленный ЭЛАР

 

В конечном счете, мы исходили из принципов удобства, гибкости, кроссплатформенности и мобильности. Поэтому сегодня «ЭЛАР Контекст» – это возможность работы с любыми ОС и СУБД без привязки к иностранному ПО, дружелюбный веб-интерфейс для различных устройств, широкие возможности интеграции и развитый современный функционал, призванный автоматизировать максимальное количество рутинных операций.

 

Структура сервис-ориентированной ECM-платформы «ЭЛАР Контекст»

Структура сервис-ориентированной ECM-платформы «ЭЛАР Контекст»

 

Возможности ИИ в ECM

Основные функции модуля «Документопоток» как части ЕСМ-системы «ЭЛАР Контекст» - это распознавание и классификация документов. Источники ввода документов могут быть разные – ИИ разбирает документы по типам и собирает комплекты. Далее из каждого комплекта извлекается информация и загружается в электронный архив.

Автоматическое распознавание может быть скомбинировано с услугами сервисной обработки специализированными операторами для документов со сложным рукописным текстом.

 

«Документопоток» - модуль интеллектуальной обработки в «ЭЛАР Контекст»

«Документопоток» - модуль интеллектуальной обработки в «ЭЛАР Контекст»

 

Что касается интеллектуального поиска, то подобный модуль также является частью платформы «ЭЛАР Контекст» и заложен в ее базовом функционале. Он способен формировать аннотации к документам, искать по полным текстам и атрибутам, понимать морфологию русского языка и выдавать релевантные результаты для различных категорий пользователей. К примеру, запрос «заявление» для сотрудника бухгалтерии и юридической службы означает поиск совершенно разных документов. В первом случае, это может быть заявление на отпуск, во втором исковое заявление. Система должна определить принадлежность запроса к определенной группе пользователей и выдать правильный результат.

В целом применение ИИ – это история не про маркетинг. Сейчас многие эксперты признают, что во главу угла ставится консалтинг. Невозможно внедрить систему, заранее не обследовав объект автоматизации, не научив систему работать, особенно с очень сложными документами. Использование искусственного интеллекта не самоцель, ради громкой вывески, а прикладное средство для решения задач заказчика.

Кейсы применения ИИ

Модуль «Документопоток» для распознавания паспортов из точек POS-кредитования мы применяли в банке ТОП-50. Из тысячи точек, расположенных по всей стране стекались комплекты документов, причем в одном случае документы сканировались, в другом фотографировались. Все эти файлы единым потоком обрабатывались, классифицировались и распознавались со скоростью 15 документов в секунду и не менее 10 тысяч документов в час. Достигнутый эффект – сокращение времени принятия решений и увеличение количества клиентов банка. В ходе этого проекта мы добились 95 % качества распознавания документов.

Автоматическая обработка документов из точек POS-кредитования в банке ТОП-50 про помощи модуля «Документопоток»

Автоматическая обработка документов из точек POS-кредитования в банке ТОП-50 про помощи модуля «Документопоток»

 

В другом проекте в банке ТОП-5 наше решение позволило автоматизировать обработку более 90% документов основного сшива, где интеллектуальный модуль в автоматическом режиме связывал данные из АБС и документы в электронном архиве ECM.

Еще один проект, где мы внедрили систему, способную сканировать и распознавать порядка миллиона документов ежемесячно, был реализован в банке ТОП-3 Казахстана.

Таким образом, можно утверждать, что ИИ в ECM – это успешный и эффективный тандем. И мы всячески поддерживаем его использование, разрабатывая интеллектуальные модули для нашей ECM-платформы «ЭЛАР Контекст».

Автор: Александр Кузнецов, руководитель направления ЕСМ корпорации ЭЛАР

Рубрики: Интеграция

Ключевые слова: электронный документооборот, ECM, ЭЛАР