Искусственный интеллект – это способность машины принимать какие-либо решения за человека, заниматься аналитикой, брать на себя типовые рутинные операции. Термин «искусственный интеллект» был принят на Дартмутской конференции в 1956 году. В 1964 году появился первый чат-бот ELIZA.
Руководитель направления ЕСМ компании ЭЛАР Александр Кузнецов
В 1980-х годах в приоритете оказались информатизация и распространение персональных компьютеров. Всплеск интереса к ИИ произошел в 1997 году, когда на легендарном шахматном матче всемирно известный гроссмейстер Гарри Каспаров проиграл искусственному интеллекту Deep Blue. В 2016 году ИИ-системы достигли вершины торжества: машина AlphaGO одержала победу над Ли Седолем – абсолютным чемпионом мира по игре в Го. Чемпион сделал все возможное, он провел великолепный матч, но все равно проиграл. Машина сделала невероятное – использовала не только заученные ходы, но и сумела импровизировать. Турнир доказал: ИИ можно научить думать!
Важнейшие этапы развития искусственного интеллекта
Сегодня мы наблюдаем стремительное развитие решений на основе ИИ, которые находят применение в различных сферах: аналитика, работа с большими данными, планирование, медицина, безопасность, общественный транспорт…
ИТ-рынок систем управления контентом делится на две категории: технологии для решения насущных проблем и инновационные разработки в духе цифровизации. Первая категория включает электронные архивы, СЭД, отраслевые системы, которые хорошо знакомы пользователям и есть практически у каждого вендора. Вторая – это любимые маркетингом хайповые темы: искусственный интеллект, блокчейн, роботизация.
Искусственный интеллект действительно очень полезная технология для ЕСМ, но нужно отделять реальную пользу от маркетинга. Очевидно, что ИИ полезен в обработке документов. Но если мы беремся за распознавание архивных исторических или документов со слитным рукописным текстом, одного ИИ будет недостаточно. В этом случае необходим комплексный подход, в том числе с привлечением человеческих ресурсов в виде аналитиков, верификаторов и операторов индексирования.
С нашей точки зрения для работы с контентом наиболее оптимальным выглядит применение ИИ в двух сферах: классификация и распознавание документов и интеллектуальный поиск. Оба этих направления мы активно разрабатываем и применяем в рамках нашей ЕСМ-платформы «ЭЛАР Контекст».
Исторически сложилось, что ИИ мы используем довольно давно. Компания ЭЛАР известна, как крупнейший в Европе подрядчик по оцифровке документов и исполнитель национальных проектов: «Память народа», Национальная электронная библиотека и многих других. Но мало кто знает, что различные интеллектуальные алгоритмы мы разрабатываем и применяем почти в каждом проекте уже более 15 лет, еще с того момента, когда они не были так широко распространены. Например, при выполнении работ по оцифровке ИИ помогает операторам извлекать информацию из рукописных дел: делит скан-копии на фрагменты и помечает необходимый для извлечения текст. Затем сопоставляет информацию, выявляет и исправляет расхождения. В итоге комбинация человеческого труда и искусственного интеллекта позволяет исключить ошибки индексирования и существенно облегчить работу операторов.
ЭЛАР использует ИИ в работе с документами уже 15 лет
В сфере интеллектуального поиска, мы одни из первых начали применять инновационные алгоритмы дедубликации, которые позволяют в автоматическом режиме сравнивать одинаковые по смыслу и содержанию результаты в рамках одного поискового запроса и выдавать пользователю только один нужный.
Алгоритмы «умного поиска» отработаны компанией ЭЛАР на крупнейших проектах
Подобные технологии на основе ИИ мы перенесли в нашу ЕСМ-платформу «ЭЛАР Контекст», которая построена на современной сервис-ориентированной архитектуре и позволяет реализовать модульный принцип создания ИТ-решений. Благодаря чему клиенты получают только востребованный функционал без избыточных или ненужных опций и имеют возможность легко масштабировать систему с помощью покупки необходимых функциональных модулей, в том числе на базе ИИ.
«Умная» модульная ECM «ЭЛАР Контекст» вобрала весь опыт, накопленный ЭЛАР
В конечном счете, мы исходили из принципов удобства, гибкости, кроссплатформенности и мобильности. Поэтому сегодня «ЭЛАР Контекст» – это возможность работы с любыми ОС и СУБД без привязки к иностранному ПО, дружелюбный веб-интерфейс для различных устройств, широкие возможности интеграции и развитый современный функционал, призванный автоматизировать максимальное количество рутинных операций.
Структура сервис-ориентированной ECM-платформы «ЭЛАР Контекст»
Основные функции модуля «Документопоток» как части ЕСМ-системы «ЭЛАР Контекст» - это распознавание и классификация документов. Источники ввода документов могут быть разные – ИИ разбирает документы по типам и собирает комплекты. Далее из каждого комплекта извлекается информация и загружается в электронный архив.
Автоматическое распознавание может быть скомбинировано с услугами сервисной обработки специализированными операторами для документов со сложным рукописным текстом.
«Документопоток» - модуль интеллектуальной обработки в «ЭЛАР Контекст»
Что касается интеллектуального поиска, то подобный модуль также является частью платформы «ЭЛАР Контекст» и заложен в ее базовом функционале. Он способен формировать аннотации к документам, искать по полным текстам и атрибутам, понимать морфологию русского языка и выдавать релевантные результаты для различных категорий пользователей. К примеру, запрос «заявление» для сотрудника бухгалтерии и юридической службы означает поиск совершенно разных документов. В первом случае, это может быть заявление на отпуск, во втором исковое заявление. Система должна определить принадлежность запроса к определенной группе пользователей и выдать правильный результат.
В целом применение ИИ – это история не про маркетинг. Сейчас многие эксперты признают, что во главу угла ставится консалтинг. Невозможно внедрить систему, заранее не обследовав объект автоматизации, не научив систему работать, особенно с очень сложными документами. Использование искусственного интеллекта не самоцель, ради громкой вывески, а прикладное средство для решения задач заказчика.
Модуль «Документопоток» для распознавания паспортов из точек POS-кредитования мы применяли в банке ТОП-50. Из тысячи точек, расположенных по всей стране стекались комплекты документов, причем в одном случае документы сканировались, в другом фотографировались. Все эти файлы единым потоком обрабатывались, классифицировались и распознавались со скоростью 15 документов в секунду и не менее 10 тысяч документов в час. Достигнутый эффект – сокращение времени принятия решений и увеличение количества клиентов банка. В ходе этого проекта мы добились 95 % качества распознавания документов.
Автоматическая обработка документов из точек POS-кредитования в банке ТОП-50 про помощи модуля «Документопоток»
В другом проекте в банке ТОП-5 наше решение позволило автоматизировать обработку более 90% документов основного сшива, где интеллектуальный модуль в автоматическом режиме связывал данные из АБС и документы в электронном архиве ECM.
Еще один проект, где мы внедрили систему, способную сканировать и распознавать порядка миллиона документов ежемесячно, был реализован в банке ТОП-3 Казахстана.
Таким образом, можно утверждать, что ИИ в ECM – это успешный и эффективный тандем. И мы всячески поддерживаем его использование, разрабатывая интеллектуальные модули для нашей ECM-платформы «ЭЛАР Контекст».
Автор: Александр Кузнецов, руководитель направления ЕСМ корпорации ЭЛАР