Интеллектуальная обработка документов. Сферы применения, импортозамещающие решения, комментарии экспертов российского ИТ-рынка

В каких ситуациях интеллектуальная обработка документов необходима или значительно облегчает работу, а когда не приносит существенной пользы? Какие перспективы у ИИ-технологий в части работы с документами и как их развитие отразится на процессах работы с данными? Достаточно ли импортозамещающих ИИ-продуктов присутствует на отечественном рынке? Об этом за круглым столом ICT-Online.ru беседуют эксперты ГК «ЭОС», «ДоксВижн», «ИнтерТраст», «Интерпроком», ЭЛАР, WSS-Consulting, «Девелоника» (ГК Softline), Directum, RAMAX Group и СИНТЕЛЛЕКТ.

ICT-Online.ru: По вашим наблюдениям, в каких случаях и на каких участках работы с документами наиболее часто применяется интеллектуальная обработка? А когда она является излишней?

Генеральный директор ГК «ЭОС» Андрей Козлов: В системах документооборота можно выделить несколько участков, где успешно применяются алгоритмы нейронных сетей. Все они связаны с необходимостью выполнения значительного количества плохо алгоритмизуемых действий. В первую очередь участок обработки поступающих в организацию документов – а именно, задача их классификации по видам и темам. Особенно актуально это в случаях, когда поток документов достаточно большой. Автоматическая классификация позволяет максимально быстро определить, к чьей компетенции документ относится, и направить его исполнителю. Следовательно, появляется дополнительное время для содержательной работы с документом. Это особенно важно, когда жестко установлены сроки рассмотрения и подготовки ответа. В частности, при работе с обращениями граждан.

 

Генеральный директор ГК «ЭОС» Андрей Козлов

 

Излишней эта технология является, во-первых, при небольших объемах поступающих документов, а во-вторых, в случаях, когда трудозатраты на обучение и тестирование нейросети многократно превышают трудозатраты на, собственно, обработку документов. Кроме того, при отсутствии выверенной выборки корректно классифицированных текстов все усилия окажутся в итоге напрасными. И чем больше классификационных признаков, тем большее количество «правильных» документов должно быть, чтобы обучение нейросети стало результативным.

Другая актуальная задача, успешно решаемая с помощью ИИ - нечеткий поиск, поиск по смыслу, интеллектуальный поиск. Объем данных продолжает расти, стандартных поисковых средств становится недостаточно. Эта задача также успешно решается с помощью ИИ-инструментария.

Президент компании «ДоксВижн» Владимир Андреев: ИИ, безусловно, важнейший тренд, но внимание к нему несколько преувеличено, пока применение ИИ – удел ранних инноваторов. Помимо классической задачи распознавания, которая тоже реализуется с использованием ИИ, типовые задачи, с которыми может справляться ИИ в документообороте – это автоматическая классификация документов (например, обращений граждан) и анализ текстов (например, на наличие отклонений в типовых договорах и т.п.). Также возможно применение ИИ в задачах аннотирования текста и выявления смысловых элементов, например, разбор стенограммы совещания и автоматическое формирование заданий по исполнению его решений. Все упирается в наличие достаточного количества релевантных данных, на основании которых можно проводить обучение, и достаточно высокая сложность самого объекта – произвольного неструктурированного текста.

 

Президент компании «ДоксВижн» Владимир Андреев

 

Однако технологии ИИ все-таки находят себе эффективное применение в некоторых специфических отраслевых задачах, таких как, например, выявление некомплектности документов в сложной проектной документации и аномальных отклонений в форматах оформления документов, анализ повторных обращений граждан с жалобами по различным каналам и тому подобное.

Директор центра развития бизнеса компании «ИнтерТраст» Вадим Ипатов: Интеллектуальная обработка документов становится незаменимой там, где ключевыми являются автоматизация повторяющихся процессов, извлечение и классификация данных. Она особенно ценна при работе с большим количеством документов, включая нормативные акты, договоры и отчеты, где машины обрабатывают и анализируют информацию с быстротой и точностью, недостижимыми для человека. В этом контексте обработка означает автоматическое заполнение реквизитов и определение маршрута документа, что существенно упрощает и ускоряет работу с документами. Интеллектуальные инструменты обработки информации находят свое применение и в работе руководителей, которые тратят значительное время на выдачу резолюций и направление документов к исполнителям. Механизмы, основанные на использовании искусственных нейронных сетей, способные к непрерывному самообучению, позволяют прогнозировать решения руководства, упрощая и оптимизируя процесс работы с документами.

 

Директор центра развития бизнеса компании «ИнтерТраст» Вадим Ипатов

 

Однако интеллектуальная обработка может быть излишней в случаях, когда документы требуют индивидуального подхода или тонкого понимания контекста, которое в настоящее время сложно достичь с помощью машинного обучения. Это может включать в себя документы, которые требуют креативного или критического мышления, такие как написание статей, создание рекламных материалов или анализ сложных юридических вопросов.

Ведущий архитектор решений компании «Интерпроком» Игорь Бреус: Один из ключевых векторов развития работы с документами направлен на максимальное упрощение и удобство для пользователей, избавления от рутинных функций и повышения эффективной работы. Если автоматизация обработки документов направлена традиционно на оцифровку бумажных документов, то интеллектуальная обработка нацелена на их анализ и автоматизацию работы по определенному сценарию.

 

Ведущий архитектор решений компании «Интерпроком» Игорь Бреус

 

С ростом объемов документов возрастает потребность в более быстром и интеллектуальном поиске нужной информации, а ежедневный ввод большого числа документов, когда для каждого документа создается карточка с метаданными, - это очень скучная работа, требующая высокой концентрации внимания. Поэтому СЭД/ЕСМ оснащают все более разумными средствами для максимально быстрого поиска необходимой информации, ввода первичной информации, регистрации и заполнения карточки документа, распределения документов по категориям, определения исполнителя и маршрутизации, выстраивания взаимосвязей между документами.

Наибольший эффект проявляется при работе с большими объемами входящих и исходящих документов, в частности, у госорганов, финансового сектора, ритейла, энергетического сектора.

Интеллектуальная обработка документов никогда не бывает излишней. Однако, сегодня мы говорим скорее о дополненном интеллекте в помощь человеку, а не полноценном искусственном интеллекте, и здесь все упирается скорее в адекватность решения ИИ поставленным задачам, степень вовлеченности человека и уровень необходимого контроля с его стороны за результатом.

Руководитель направления ECM корпорации ЭЛАР Александр Кузнецов: Сегодня задачи интеллектуальной обработки шире, чем раньше. Еще несколько лет назад технологии OCR по-настоящему эффективно использовались только для распознавания формализованных документов, например, анкет, с целью извлечения полей и занесения их в базу данных. С течением времени появились возможности работать с неформализованными документами. Но такие решения строились на использовании шаблонов распознавания – жестких или гибких, которые были основаны на детерминированных алгоритмах, то есть жестко заданных функциях. Такой подход - это одна из ступеней эволюции процессов автоматизированной обработки документов. Повторить задачи, которые решаются на данный момент с помощью ИИ, он не может.

 

Руководитель направления ECM корпорации ЭЛАР Александр Кузнецов

 

В сложных условиях роста видов и объемов данных нужна произвольность в выборе последовательности действий, так как мы не знаем, какого рода информация или тип документа может поступить на обработку. Система должна быть обучена ориентироваться в потоках документов и самостоятельно определять наиболее оптимальные алгоритмы обработки.

В этой связи, если OCR, по сути, это извлечение данных по шаблону с ограниченным применением, то ИИ – конвейер, на каждом этапе которого производится полезная для деятельности учреждения операция. Сегодня ИИ помогает человеку распределять документы, изучать и анализировать данные, наполнять информационные системы полезными сведениями и, наконец, принимать решения.

Наиболее востребованные с точки зрения интеллектуальной обработки направления – обработка корреспонденции, управленческой, кадровой и финансовой документации, распознавание архивов технической документации, обработка клиентских досье и работа по нормализации реестров и баз данных, интеллектуальный анализ, сравнение и поиск документов, построение комплексных систем помощи принятия решений.

Генеральный директор WSS-Consulting Геннадий Попов: Востребованность в ИИ среди наших клиентов невысокая. В приоритете применяются платформы для реализации распознавания входящего потока бумажных первичных документов с дальнейшей обработкой в СЭД: требование-накладная (М-11); акт на списание ТМЦ; акт о выявленных дефектах (ВН-ТМЦ-3); акт о приеме-передаче объектов основных средств (кроме зданий, сооружений) (ОС-1, ОС-1а, ОС-1б); акт о списании объекта основных средств (кроме автотранспортных средств) (ОС-4, ОС-4а, ОС-4б); акт о приеме-передаче малоценных основных средств (ВН-ОС-1); накладная на внутреннее перемещение объектов основных средств (ОС-2); инвентаризационная опись (ИНВ-1, ИНВ-3).

 

Генеральный директор WSS-Consulting Геннадий Попов

 

Ведущий руководитель проектов компании «Девелоника» (ГК Softline) Денис Моисеенко: Технологии ИИ применяются на различных этапах обработки внешнего и внутреннего документооборота. Наиболее сложная задача - обработка внешних, плохо структурированных данных, превращение бумажных документов в электронные, классификация их и направление по правильному процессу в систему. Также при обработке внутренних документов применение ИИ может ускорить процесс принятия решений.

 

Ведущий руководитель проектов компании «Девелоника» (ГК Softline) Денис Моисеенко

 

Руководитель проектов по развитию AI-продуктов компании Directum Илья Петухов: Самый частый кейс – поступление документа в организацию. Так, если счет приносят на бумаге, то секретарь вручную его сканирует, вводит в информационную систему либо регистрирует в журнале. В случае если документ присылают по электронной почте на общий email компании или на адрес конкретного сотрудника, то ответственный заносит его в систему, регистрирует, и уже здесь работает с ним. И третий канал, по которому может поступить счет на оплату или иной документ, это сервисы ЭДО.

 

Руководитель проектов по развитию AI-продуктов компании Directum Илья Петухов

 

Во всех описанных случаях не обязательна «ручная» работа сотрудников (сканирование, занесение, регистрация, заполнение карточки в системе), часть операций за человека готовы сделать интеллектуальные сервисы.

Где еще бесценна роль ИИ, так это при миграции исторических данных из одной системы в другую. Если раньше документационный фонд компании «перевозили» вручную, то теперь эту задачу можно доверить искусственному интеллекту. Он обрабатывает документы – классифицирует по видам, структурирует, извлекает текст – помещает в новую базу данных в соответствии с принятыми в ней правилами хранения. А человек здесь выступает как наблюдатель и контролер.

Можно ли сказать, что иногда интеллектуальная обработка документов излишняя? Я считаю, что нет. ИИ подсвечивает моменты, на которые человек порой не обращает внимания. Он ускоряет процессы при большом потоке документов. Единственный случай, когда умная обработка может быть лишней, это когда один сотрудник обрабатывает маленький объем документов и вполне справляется с этим. Хотя даже здесь можно получить пользу. Кому не захочется избавиться от рутины в работе?

Эксперт по OCR-решениям RAMAX Group Ольга Гриценко: В настоящее время развитие технологий и появление новых продуктов для интеллектуальной обработки документов (англ. IDP, Intelligent Document Processing) позволяет компаниям автоматизировать большую часть этапов документооборота. Такой подход во многом помогает освободить сотрудников предприятия от рутинных действий, избежать человеческих ошибок при обработке огромных объемов информации, а также повысить скорость работы с документами. Для классификации и извлечения данных из структурированных (анкеты, налоговые декларации), слабоструктурированных (счета на оплату, накладные) и неструктурированных документов (письма, пояснительные записки) при интеллектуальной обработке документов обычно используется такие технологии, как оптическое распознавание символов (англ. OCR, Optical Character Recognition), обработка естественного языка (англ. NLP, Natural Language Processing), RPA-технологии, компьютерное зрение и машинное обучение.

 

Эксперт по OCR-решениям RAMAX Group Ольга Гриценко

 

На мой взгляд, автоматизация полезна на таких этапах, как ввод документов, извлечение данных, их упорядочивание и передача в целевую систему, а также хранение документов в едином цифровом пространстве посредством внедрения электронного архива. Однако степень автоматизации любого процесса должна определяться его особенностями, целями и требованиями к проекту, поэтому мы не должны полностью исключать человека из процесса документооборота. Для максимальной эффективности работы любой автоматизированной системы имеет смысл соблюдать баланс скорости и качества, оставляя возможность оператору системы выполнять часть проверок и контроля правильности извлечения данных.

Руководитель отдела продуктовых решений СИНТЕЛЛЕКТ Юлия Галлямова: Сегодня компании активно используют возможности искусственного интеллекта для обработки входящих документов. Спектр применения очень широк и затрагивает абсолютно разные сферы бизнеса - в банках, например, это распознавание паспортов и заявлений, в сфере ритейла - финансовых документов, также это актуально для всех компаний с большим потоком входящих документов, из которых надо внести в систему множество метаданных.

 

Руководитель отдела продуктовых решений СИНТЕЛЛЕКТ Юлия Галлямова

 

При этом излишней данная функциональность будет в тех случаях, когда параметров, которые надо распознать из документа, не так много, а сам документ неструктурированный. В таком случае оператор столько же потратит времени на поиск нужных данных глазами на документе и внесение их вручную в систему, сколько и на автоматическое распознавание, плюс верификацию данных.

ICT-Online.ru: Какие интересные технологии интеллектуальной обработки документов уже прочно вошли в работу, а какие только появились, но уже вызывают горячий интерес?

Андрей Козлов (ГК «ЭОС»): Если говорить об общих принципах, на которых базируются практически все ИИ-технологии, используемые в работе с документами, то это все тот же алгоритм обучения нейронных сетей, в основе которого метод обратного распространения ошибок, впервые описанный в середине 70-х годов прошлого века и существенно развитый в середине 1980-х. Для обработки текста широкое распространение также получил алгоритм BERT, представленный в 2018 году и предусматривающий двунаправленное обучение: контекст слова определяется на основе окружения как слева, так и справа от слова (в отличии от классической модели обучения «слева-направо»).

Если говорить собственно об интеллектуальной обработке, то здесь достаточно давно и успешно используются технологии извлечения значимых данных из документов (как структурированных, так и неструктурированных) – сведений об авторах (корреспондентах), дат, номеров, ключевых слов и так далее. Классификация (рубрицирование и распределение по компетенции) поступающих документов с помощью технологий ИИ используется меньше по времени, но уже стала одним из часто встречающихся требований заказчиков при выборе корпоративной системы автоматизации документооборота. AI-технологии также позволяют готовить проекты поручений к документам, назначить исполнителей и установить срок выполнения.

Вадим Ипатов («ИнтерТраст»): Прочно вошли в работу технологии OCR (оптическое распознавание символов), NLP (обработка естественного языка) и RPA (роботизированная автоматизация процессов). Новые интересные технологии включают искусственный интеллект и машинное обучение, блокчейн, семантический анализ и когнитивный поиск.

«Интерпроком» является индустриальным партнёром Центра доверенного искусственного интеллекта ИСП РАН и ведет совместные работы по прикладному внедрению теоретических разработок и технологий ИСП РАН в процессы ТОиР с применением в ПО «АКСИОМА» ИИ на основе СПО «Талисман». Например, в контексте электронного обмена специализированными документами для управления корпоративными материальными активами и ТОиР искусственный интеллект может помочь в составлении и анализе таких сложных документов, как технологические карты. Об этом рассказывает ведущий архитектор решений компании «Интерпроком» Игорь Бреус (см. интервью раздела «Интерпроком» от 18 октября 2023 г.).

Игорь Бреус («Интерпроком»): В решениях для интеллектуальной обработки данных под капотом можно увидеть широкий спектр современных технологий, например, оптического распознавания, включая рукописные тексты и графические изображения, технологии классификации, глубокого анализа BI и извлечения значимых данных, QR-коды, чат-боты и программные роботы, инструменты совместной работы, перевод на различные языки и многое другое.

В последнее время в различных сферах деятельности, в том числе и в обработке документов, мы можем наблюдать большой интерес к технологиям искусственного интеллекта и машинного обучения, в частности, нейросетей. Растет не только интерес, но и число их растет, и сами сервисы развиваются активно: ChatGPT, Yandex GPT, SistemmaGPT, ChatSonic - список можно продолжить. При работе с документами нейросети способны создавать контент, например, подготавливать черновики писем, заявок, обращений, претензий, исков, отзывов и пр., что существенно облегчает пользователю жизнь. Ему остается проверить и при необходимости внеси корректировки, а вся предварительная работа уже выполнена. Генерирующие возможности ИИ позволят расширить набор умных сервисов, которые можно будет встраивать в различные системы.

Александр Кузнецов (ЭЛАР): Обработка – собирательное понятие. Сюда входит классификация документов, распознавание, аналитика, нормализация, извлечение данных и еще много чего. Так или иначе искусственный интеллект можно применять в различных бизнес-процессах. Если документы очень сложны в распознавании, ИИ сможет разложить их по классам, определив тип каждого документа, найти и собрать многостраничные документы. Пометить нужные для извлечения данных блоки. Затем какие-то документы распознать автоматически, а какие-то направить человеку для верификации или ручного ввода, при этом помогая оператору нормализовать данные или заполнить недостающие значения в базе с помощью справочников. Подобные решения уже активно используются.

Большой интерес вызывают платформенные решения, когда система может использоваться в рамках нескольких задач и иметь возможность обучения для расширения функциональности. Это позволяет отказаться от разрозненных разработок и строить продукт по единым корпоративным стандартам, при этом сохраняя этапность и последовательность, так как такие платформы обладают модульной структурой и могут внедряться планомерно с учетом ежегодных планов бюджетирования.

Еще один важный фактор – гибкость. Поэтому технологии в основе платформенного решения должны быть открыты и позволять проводить индивидуальную доработку под задачи определенного заказчика. Это особенно актуально для крупных корпоративных клиентов с нестандартными бизнес-процессами, которые могут быть уникальными и выполняться только в конкретной компании.

Таким образом набирают обороты No-Code / Low-Code конструкторы решений, позволяющие существенно экономить средства и время при настройке и адаптации платформы.

Для того, чтобы эффективно работать с проектной нагрузкой, высчитывать все рабочие и нерабочие активности, отпуска, больничные, переработки и правильно рассчитать ФОТ, компания «Девелоника» использует решения «Девтайм» и «Девелоника РМ». Если заказчику интересны процессы автоматизации налогового учета или планирования, компания помогает настроить витрину данных, мониторинг или налоговую выверку по всем стандартам взаимодействия с ФНС. Об этом рассказывает ведущий руководитель проектов компании «Девелоника» (ГК Softline) Денис Моисеенко (см. интервью раздела «Softline» от 17 октября 2023 г.).

Денис Моисеенко («Девелоника»): Когда мы говорим о процессах интеллектуальной обработки данных, то выделяем три направления: распознавание и извлечение информации, интеграцию с системами и автоматизацию процессов. Последние два - особенно интересны с точки зрения заказной разработки. Сегодня судя по проектам, можно сказать, что отечественному бизнесу интересны инструменты по оптимизации внутренних процессов. Управление трудозатратами, облегчение взаимодействия с контрагентами или государственными институтами, аналитика и отчетность, а также организация хранения информации - каждую из перечисленных задач можно отнести к актуальным для российских компаний. Если говорить про новые способы обработки и системы по управлению базами данных, то тут однозначно рынок проявляет интерес к графовым СУБД. У такого решения есть сравнительные преимущества перед традиционными реляционными СУБД, особенно для компаний в фин- и госсекторе.

Илья Петухов (Directum): Уже давно на рынке есть технология обработки документов OCR. Некоторые не связывают ее с искусственным интеллектом, но в любом случае OCR включает в себя библиотеки, которые идентифицируют символы.

Кто-то относит к интеллектуальной обработке технологию RPA, но она способна только взять документы и перенести их в другое место. Обработка, распознавание или классификация – не в компетенциях RPA.

Что сегодня вызывает горячий интерес, так это эксперименты с применением генеративных моделей. Суть в том, что мы отправляем документ генеративной модели и просим ее проанализировать текст и найти необходимые данные или определить паттерны. Генеративные модели могут анализировать текст, сокращать его и создавать новый контент. Человек получает черновик протокола совещания или проекта резолюции. Ему останется проверить вариант, предложенный ИИ, дополнить его и отправить задачу по маршруту.

Ольга Гриценко (RAMAX Group): Как несомненные лидеры в области интеллектуальной обработки документов, себя уже давно зарекомендовали такие компании, как ABBYY, Kofax, Automation Anywhere, WorkFusion, Blue Prism и UiPath. Большой популярностью пользуются системы потокового сканирования, такие как, например, ABBYY FlexiCapture или Сойка, включающие полный процесс обработки документов, начиная с их ввода в систему, распознавания и структурирования распознанных данных, до контроля, верификации и интеграции с целевой системой для дальнейшей передачи извлеченной информации и скан-образов документов. Такие системы позволяют построить сложные потоки операций для обработки распознанных данных и предоставляют большое количество инструментов для реализации разнообразных проверок, минимизирующих вмешательство со стороны операторов. Технологии полнотекстового поиска, такие как Elasticsearch или CuneiForm, стали неотъемлемой частью любой системы для создания электронного архива - единого цифрового пространства для удобства хранения всех документов.

Что касается компаний, которые появились на рынке относительно недавно, но уже громко заявили о себе, я бы обратила особое внимание на решение ContentCapture от компании Content AI, которая является технологическим «наследником» ABBYY. Указанное решение сохранило всю обширную экспертизу ABBYY FlexiCapture, при этом оно полностью адаптировано под особенности и потребности российского рынка.

Юлия Галлямова (СИНТЕЛЛЕКТ): По опыту могу сказать, что прочно вошли в работу самообучаемые модули по классификации документов и настройка форм распознавания (как с помощью жестких условий, так и на основании разметки и обучения системы на множестве примеров документов).

Из того, что сейчас вызывает живой интерес на рынке - это не только определение тематики входящего документа, но и самообучаемая система для автоматического распределения в профильные департаменты поручений по исполнению данного документа. Особенно актуально это для обращений граждан, которые для любой организации являются существенной нагрузкой с высоким процентом ручного труда по вычитке данных писем.

ICT-Online.ru: Есть ли достойные импортозамещающие продукты на российском рынке?

Элементы ИИ-технологий есть во многих проектах ЭОС, если говорить об интеллектуальной обработке документов и «умном» поиске. В последние несколько лет был реализован ряд проектов, где с помощью AI-инструментария решались задачи классификации документов и их последующей маршрутизации. Один из наиболее «свежих», использующий актуальные технологии и возможности – проект в Ростовской области. Об этом рассказывает генеральный директор ГК «ЭОС» Андрей Козлов (см. интервью раздела «ЭОС» от 11 октября 2023 г.).

Андрей Козлов (ГК «ЭОС»): Да, есть целый ряд российских разработок. Запросы на повышение «уровня интеллектуальности» ИТ-продуктов сегодня в тренде, особенно для бизнеса, где лидерами по «интеллектуальным» потребностям являются ритейл и финансы, самые, пожалуй, технологически развитые отрасли российской экономики. Эти потребности во многом служат драйверами для отечественных разработчиков. Сегодня есть Deep Pavlov, библиотека для создания виртуальных ассистентов и анализа текста, есть набор программных продуктов Intelligent Search, известный сейчас как Content AI Intelligent Search.

Игорь Бреус («Интерпроком»): В Реестре российского ПО достаточно широкий спектр интеллектуального программного обеспечения, и большая часть представляет собой прикладное ПО для решения конкретных задач с использованием ИИ.

Чтобы ИИ заработал на базе программного инструментария, необходимо создать прикладное решение, нацеленное на конкретную задачу. Очень важно глубоко разбираться в специфике задачи, сформировать объем данных, необходимый для статистического анализа, разработать модели, алгоритмы, системы самообучения, максимально близкие к нативным интеллектуальным возможностям, которые использует человек.

Компания ЭЛАР реализовала большое количество проектов по автоматизации обработки и хранения документов. Программные решения из Реестра отечественного ПО («ЭЛАР Документопоток», ЭЛАР Контекст, АИС ЭЛАР Архив), а также отечественная радиоэлектронная продукция собственного производства, включенная в Реестр РЭП Минпромторга в составе планетарных сканеров ЭларСкан и систем долговременного хранения данных ЭЛАР НСМ, обеспечивают удовлетворение потребностей заказчиков, связанных с оцифровкой, обработкой, хранением и защитой информации и документов. Об этом рассказывает руководитель направления ECM корпорации ЭЛАР Александр Кузнецов (см. интервью раздела «ЭЛАР» от 16 октября 2023 г.).

Александр Кузнецов (ЭЛАР): Да, есть. Отечественные решения ни в чем не уступают западным аналогам. А с учетом того, что они лучше адаптированы под российскую специфику, российские продукты становятся наиболее оптимальным вариантом не только с точки зрения импортозамещения, но и функциональности.

Геннадий Попов (WSS-Consulting): На наш взгляд, рынок ИИ в РФ только начинает своё развитие и имеет хорошие перспективы, в том числе и в работе с документами.

Денис Моисеенко («Девелоника»): Да, рынок заказной разработки предлагает альтернативы. Решения, которые могут помочь как среднему, так и крупному бизнесу, как представителю ретейла, так и промышленникам. Во многом это определяет схожесть внутренних процессов в плане обработки документации, в том числе бухгалтерского учета и налоговой отчетности. В этом вопросе нужно грамотно подобрать подрядчика/партнера, который обеспечит уверенность в качестве разработки, уверенность в лицензиях и технической поддержке. Компании с высоким уровнем экспертизы точно смогут проанализировать вашу текущую ситуацию и помогут выбрать идеальный вариант с импортозамещенным стеком.

Илья Петухов (Directum): В начале 2023 года портал ECM-Journal провел обзор интеллектуальных возможностей российских СЭД, ECM, BPM-систем. Исследование показало, что в нашей стране действительно есть достойная альтернатива западным ИИ-продуктам. Один из таких продуктов – система Directum Ario One, которая успешно выполняет задачу интеллектуальной обработки документов, включая распознавание, классификацию и маршрутизацию.

Если рассматривать более широкий спектр возможностей, когда ИИ участвует не только в обработке контента, но и встраивается в бизнес-процессы компании, то могу привести в пример систему Directum RX Intelligence. Встроенные интеллектуальные инструменты включаются в работу с документами на всех этапах – от их поступления в организацию до передачи на хранение и уничтожение. Таким образом, сотрудник может только «сверху» наблюдать за процессом ИИ-обработки и проверять результат, выданный ИИ.

Ольга Гриценко (RAMAX Group): Конечно, на данный момент интерес представляют не только иностранные компании, но в первую очередь отечественные решения. К примеру, в 2022 году продажи и техподдержка пользователей и партнёров ABBYY в России и СНГ перешли к Content AI. Данная компания выпустила ContentCapture - специальную платформу для интеллектуальной обработки документов с возможностью интеграции решения в ИТ-ландшафт предприятий, работающих с отечественным ПО. Как уже упоминалось выше, к достойным импортозамещающим продуктам можно отнести Soika, SberIDP, Directum Ario One, SmartSel, Nlogic. У каждой системы свой курс развития. Так, SmartSel от АО «Ай-Теко», например, специализируется на обработке естественного языка в комбинации с речевыми технологиями. Кроме того, данная система предоставляет возможность работы с голосовой информацией, подключения систем распознавания и генерации речи. SberIDP, в свою очередь, отличается высоким качеством распознавания в том числе рукопечатного и рукописного текста, а также некоторыми интересными решениями, например, вопросно-ответной системой сервиса SberIDP Query.

Нельзя не отметить российские решения для автоматизации электронных архивов, например, Docsvision, Directum RX, «1C: Архив» и многие другие. Например, Directum предлагает встроенный механизм AI-инструментов и OCR ARIO с возможностью использования в процессах, а модуль потокового ввода Docsvision поддерживает работу со штрихкодами, идентифицирующими документ, слоями распознанного текста. По нашему опыту, внедрение электронного архива с системой распознавания позволяет в 2,5 раза сократить затраты на первичную обработку документации, маршрутизацию и сравнение документов, их регистрацию в журналах.

Интерес вызывает решение SalutRPA. Это RPA-платформа от Сбера, которая позволяет автоматизировать рутинные процессы с помощью программных роботов, легко интегрируется с различными ИТ-решениями, позволяет использовать low-code-инструменты, а также Java, C# и Python. По заявлению производителя решения, для переноса в данную систему алгоритмов с иностранных RPA-платформ достаточно всего одного дня.

Юлия Галлямова (СИНТЕЛЛЕКТ): Конечно, на российском рынке есть целый ряд продуктов, которые прекрасно справляются с классификацией и их распознаванием - имеющие водяные знаки и сложный фон (например, банковские карты, СНИЛС, паспорта, различные свидетельства и т.п.), а также продукты, имеющие широчайший набор инструментов для настройки форм распознавания неформализованных документов.

Но стоит отметить, что пока у нас нет одного идеального продукта под любые задачи интеллектуальной обработки документов: кто-то лучше справляется с одними задачами, а кто-то силён в других. Выбор конкретного продукта должен быть сделан не только на основании его зрелости, большого опыта, известности на рынке, удобства интерфейса, как это обычно принято, но и в зависимости от предстоящих задач.

Мы всегда рекомендуем проводить предварительное тестирование по предполагаемому набору разных задач, ведь ключевое в таких системах - это то, что они умеют «под капотом», то есть различные технологии по предобработке изображений, распознаванию символов и изображений в разных условиях.

Так или иначе, все российские продукты активно развиваются, и те, кто вчера неуверенно распознавали подписи и печати, но имели один из сильнейших инструментов по разработке форм, сегодня уже подтягивают свои «хвосты». В свою очередь те, кто идеально справлялся с распознаванием строго формализованных документов, начинают двигаться в сторону обработки естественного языка для извлечения параметров из неструктурированных документов. Уверена, что совсем скоро большинство наших продуктов будут еще более универсальны.

 

 

ICT-Online.ru: Где еще в ближайшем будущем может начать применяться интеллектуальная обработка данных? Как это изменит процессы работы с данными?

Андрей Козлов (ГК «ЭОС»): Конечно же, в работе с документами, но это будут уже другие технологии, качественно иные. Одним из наиболее интересных вариантов развития СЭД/ECM я вижу использование Process Mining, технологий создания цифровых двойников реальных бизнес-процессов. Очевидно, что на деле бизнес-процессы могут намного отличаться от их идеального, запроектированного варианта. Часто можно наблюдать– и в документообороте тоже – странные маршруты документов, пропуск каких-либо шагов (например, требуемого по регламенту этапа согласования), возвраты на предыдущие этапы, повторение процедур и т.д.

Process Mining позволяет не просто создавать виртуальные двойники бизнес-процессов, но и анализировать их течение, в том числе в режиме реального времени. Эта технология может использоваться для верификации разработанных сценариев бизнес-процессов и поведения пользователей, то есть для наблюдения, как они на самом деле взаимодействуют с информационной системой – при этом «испытательным полигоном» служит виртуальный двойник процесса. Цифровые двойники позволяют быстро выявить «узкие места», провести анализ «а что, если», подобрать оптимальные параметры процесса и «опубликовать» его уже в действующей системе документооборота. Использование Process Mining будет способствовать быстрому тиражированию лучших практик.

Владимир Андреев («ДоксВижн»): Техногии ИИ, безусловно, будут развиваться и дальше, но развитие это будет не быстрым и эволюционным, если не случится каких-либо революционных изменений в самих технологиях. Все-таки сегодня ИИ не способен заменить человека в таких творческих задачах, как, например, принятие управленческих решений в уникальных ситуациях, не основанных на предыдущих кейсах.

На данный момент «ИнтерТраст» развивает в CompanyMedia следующие сервисы, использующие искусственный интеллект: «Цифровой помощник», «Умный семантический поиск», «Автоматическое управление жизненным циклом нормативных документов». В качестве примера можно привести проект реализации сервиса «Цифровой помощник» в системе электронного документооборота и делопроизводства Правительства Новосибирской области, который стартовал в 2022 году. Об этом рассказывает директор центра развития бизнеса компании «ИнтерТраст» Вадим Ипатов (см. интервью раздела «ИнтерТраст» от 13 октября 2023 г.).

Вадим Ипатов («ИнтерТраст»): В наших планах развития сервиса «Цифровой помощник» на ближайшую перспективу предполагается функциональное расширение возможностей сервиса за счет интеграции дополнительного поля «Тематика» в анализируемые объекты, а также предоставление возможности внедрения в модель выдачи рекомендаций на основе содержимого самих документов.

Еще одно направление развития - это расширение полномочий «Цифрового помощника». Он будет способен без человеческого контроля автоматически классифицировать и регистрировать входящие документы в системе электронного документооборота (СЭДД). Помимо выдачи рекомендаций, «Цифровой помощник» сможет также осуществлять фактическую «роспись» документов в СЭДД.

Игорь Бреус («Интерпроком»): Например, ИИ из функций перейдет в разряд интеллектуальных доверенных ассистентов, в частности, в помощь специалистам юридического отдела или кадровикам. Они будут помогать не только в подборе данных и информации из различных источников по заданной тематике, но анализировать и подготавливать черновые варианты корпоративных документов, станут советниками при принятии решений. ИИ-ассистенты помогут еще больше упростить работу сотрудникам, повысить производительность труда, освободить от рутинной работы. Они высвободят время для дел, требующих интеллекта и творческого подхода человека, ну или помогут выкроить свободное время для чашечки чая или кофе с коллегами для хорошего настроения.

Александр Кузнецов (ЭЛАР): Сегодня бумажные документы еще важны как оригинальный источник исторической информации, и уже незаменимы электронные документы как инструмент повседневной деятельности. Поэтому искусственный интеллект будет совершенствоваться в нескольких направлениях.

Во-первых, в области обработки архивных документов. Это огромный пласт значимой и ценной информации, который еще в большом количестве представлен только на бумажном носителе. Технологии помогают снизить трудозатраты по оцифровке и анализу накопленных в бумаге данных, даже несмотря на низкую читаемость или рукописный текст.

С другой стороны, с каждым днем растут объемы цифровых данных. Если говорить о документообороте и учетной деятельности, то важным аспектом является возможность проверки, связывания и нормализации данных в рамках сквозных процессов. Например, в крупном холдинге есть несколько версий учетных систем. В каждой из них собственная база данных с одинаковыми по смыслу значениями, но разным написанием. Появляется дублирование и ошибки в привязке данных к транзакциям и документам. Нормализация таких справочников и создание единой эталонной базы - это огромный труд, требующий участия человека, чтобы провести анализ, сверку, исправление данных и удаление дублей. Поэтому снижение нагрузки на человека в процессе аналитики разнородной информации – важный вопрос, активно прорабатывающийся в ИТ-проектах.

И, наконец, работа с большими данными. Она призвана автоматизировать ключевые процессы предприятий и учреждений. Сюда можно включить совершенствование прогнозирования и аналитики, например, в финансовом секторе, процессов управления производством, обработку видео- и фотоматериалов.

Денис Моисеенко («Девелоника»): Сегодня вектор внимания смещается в сторону ИИ-технологий. К ним присматриваются в финсекторе, в частности, в банкинге. Вероятно, определенные решения станут востребованы в промышленности, в частности легкой – например, при определении качества продукции и отборе брака при помощи машинного зрения. Сегодня цель бизнеса, а значит, и заказной разработки - повысить эффективность работы с данными, точность их обработки, а также скорость выполнения рутинных операций. Перспектив для развития интеллектуальной обработки данных много, и возможности ИТ-рынка позволяют реализовывать самые ресурсоемкие инструменты, системы, сервисы и приложения.

Интеллектуальные сервисы уже готовы сделать часть операций за человека. Directum RX Intelligence, например, обладает широким потенциалом в области обработки корпоративного контента, выходит за рамки стандартного распознавания и извлечения текста, в частности, умеет определять ответственных исполнителей и генерировать контент без помощи человека. Второй продукт – Directum Ario One - система с набором интеллектуальных сервисов и решений для обработки любой текстовой информации, она может быть развернута в локальном контуре клиента. Об этом рассказывает руководитель проектов по развитию AI-продуктов компании Directum Илья Петухов (см. интервью раздела «Directum» от 12 октября 2023 г.).

Илья Петухов (Directum): В ближайшем будущем интеллектуальная обработка данных однозначно получит широкое распространение и начнет применяться в разных областях. Например, в компаниях, предоставляющих клиентский сервис. Так, энергосбытовые компании смогут использовать ИИ-сервисы, чтобы ускорить процесс заключения договоров с клиентами. Потребителям не нужно будет приходить в офис с документами и стоять в очереди. Вместо этого они смогут предоставить данные в электронном виде, а искусственный интеллект автоматически заполнит шаблон договора. Налицо экономия времени, отсутствие бумажной волокиты и рост лояльности клиентов.

Интеллектуальная обработка данных может использоваться для классификации и обработки обращений. Например, помогать службе поддержки быстрее анализировать и классифицировать входящие сообщения. Особенно неоценим такой вклад ИИ во время завалов обращений. Но когда в службах поддержки было иначе? ИИ помогает специалистам эффективнее и оперативнее реагировать на проблемы и повышать качество обслуживания.

Большую ставку мы в компании Directum делаем на развитие генеративных моделей ИИ. Нейросети уже меняют мир, представьте, как преобразится и без того интеллектуальная обработка данных, когда в состав сервисов войдут технологии генеративного ИИ.

Ольга Гриценко (RAMAX Group): С одной стороны, по мнению многих экспертов, основными двигателями развития решений интеллектуальной обработки данных еще надолго останутся финансовый сектор и ритейл. Такие предприятия, через которые ежедневно проходят огромные потоки документов, а от эффективности бизнес-процессов и снижения операционных издержек непосредственно зависит их прибыль, будут стимулировать увеличение скорости и качества работы IDP-систем. С другой - такое развитие технологий делает их более доступными для повседневной жизни, например, в области образования. Кроме того, существует ряд узконаправленных решений, которые разработаны для распознавания только определенных типов документов, таких как паспорта, карты, QR-коды, что способствует их востребованности в своей нише менее сложных, но более доступных решений.

Юлия Галлямова (СИНТЕЛЛЕКТ): Интеллектуальная обработка данных направлена не только на снижение ручного труда и экономии времени, но также и на снижение «человеческого фактора», то есть уменьшение числа ошибок и на улучшение клиентского сервиса.

Продукты этого класса с каждым днем становятся все умнее, и они еще прочнее будут входить в нашу жизнь тогда, когда мы сможем больше им доверять (будет крайне низкий процент ошибок).

В ближайшем будущем тренд на продукты интеллектуальной обработки будет укрепляться, а современные технологии смогут доказать эффективность, уверенность в выходных данных и высокую безопасность при работе с конфиденциальными данными.

ICT-Online.ru: Большое спасибо за беседу!

Автор: Анна Тумакова.

Тематики: Интеграция

Ключевые слова: СЭД, ИнтерТраст, Directum, ЭОС, WSS-Consulting, ЭЛАР, ДоксВижн, ЭДО, Syntellect, Интерпроком, Искусственный интеллект, RAMAX, Девелоника