Андрей Козлов (ЭОС): «Одним из наиболее интересных вариантов развития СЭД/ECM я вижу использование Process Mining»

Элементы ИИ-технологий есть во многих проектах ЭОС, если говорить об интеллектуальной обработке документов и «умном» поиске. В последние несколько лет был реализован ряд проектов, где с помощью AI-инструментария решались задачи классификации документов и их последующей маршрутизации. Один из наиболее «свежих», использующий актуальные технологии и возможности – проект в Ростовской области. Об этом рассказывает генеральный директор ГК «ЭОС» Андрей Козлов.

– Андрей, по вашим наблюдениям, в каких случаях и на каких участках работы с документами наиболее часто применяется интеллектуальная обработка? А когда она является излишней?

Межрегиональная конференция «Электронный документооборот как основа современного государственного и муниципального управления: опыт и перспективы развития в условиях импортозамещения» прошла 27-29 сентября 2023 года в Пятигорске – знаменитом курорте Ставропольского края, в отеле «Бештау». Мероприятие организовали «Электронные Офисные Системы» совместно с Министерством энергетики, промышленности и связи Ставропольского края и региональными партнерами «Эксперт Док» и «Бизнес ИТ» (см. новость раздела «ЭОС» от 6 октября 2023 г.).

– В системах документооборота можно выделить несколько участков, где успешно применяются алгоритмы нейронных сетей. Все они связаны с необходимостью выполнения значительного количества плохо алгоритмизуемых действий. В первую очередь участок обработки поступающих в организацию документов – а именно, задача их классификации по видам и темам. Особенно актуально это в случаях, когда поток документов достаточно большой. Автоматическая классификация позволяет максимально быстро определить, к чьей компетенции документ относится, и направить его исполнителю. Следовательно, появляется дополнительное время для содержательной работы с документом. Это особенно важно, когда жестко установлены сроки рассмотрения и подготовки ответа. В частности, при работе с обращениями граждан.

Излишней эта технология является, во-первых, при небольших объемах поступающих документов, а во-вторых, в случаях, когда трудозатраты на обучение и тестирование нейросети многократно превышают трудозатраты на, собственно, обработку документов. Кроме того, при отсутствии выверенной выборки корректно классифицированных текстов все усилия окажутся в итоге напрасными. И чем больше классификационных признаков, тем большее количество «правильных» документов должно быть, чтобы обучение нейросети стало результативным.

 

Генеральный директор ГК «ЭОС» Андрей Козлов

 

Другая актуальная задача, успешно решаемая с помощью ИИ - нечеткий поиск, поиск по смыслу, интеллектуальный поиск. Объем данных продолжает расти, стандартных поисковых средств становится недостаточно. Эта задача также успешно решается с помощью ИИ-инструментария.

– Какие интересные технологии интеллектуальной обработки документов уже прочно вошли в работу, а какие только появились, но вызывают горячий интерес?

Компания «Электронные Офисные Системы» 21 сентября приняла участие в открытии первого в России Федерального технопарка профессионального образования, состоявшемся в Калуге. Это инновационный центр с уникальными программами обучения, «старт» работе которого в ходе торжественной церемонии открытия дал Президент России Владимир Путин (см. новость раздела «ЭОС» от 29 сентября 2023 г.).

– Если говорить об общих принципах, на которых базируются практически все ИИ-технологии, используемые в работе с документами, то это все тот же алгоритм обучения нейронных сетей, в основе которого метод обратного распространения ошибок, впервые описанный в середине 70-х годов прошлого века и существенно развитый в середине 1980-х. Для обработки текста широкое распространение также получил алгоритм BERT, представленный в 2018 году и предусматривающий двунаправленное обучение: контекст слова определяется на основе окружения как слева, так и справа от слова (в отличии от классической модели обучения «слева-направо»).

Если говорить собственно об интеллектуальной обработке, то здесь достаточно давно и успешно используются технологии извлечения значимых данных из документов (как структурированных, так и неструктурированных) – сведений об авторах (корреспондентах), дат, номеров, ключевых слов и так далее. Классификация (рубрицирование и распределение по компетенции) поступающих документов с помощью технологий ИИ используется меньше по времени, но уже стала одним из часто встречающихся требований заказчиков при выборе корпоративной системы автоматизации документооборота. AI-технологии также позволяют готовить проекты поручений к документам, назначить исполнителей и установить срок выполнения.

– Есть ли достойные импортозамещающие продукты на российском рынке?

– Да, есть целый ряд российских разработок. Запросы на повышение «уровня интеллектуальности» ИТ-продуктов сегодня в тренде, особенно для бизнеса, где лидерами по «интеллектуальным» потребностям являются ритейл и финансы, самые, пожалуй, технологически развитые отрасли российской экономики. Эти потребности во многом служат драйверами для отечественных разработчиков. Сегодня есть Deep Pavlov, библиотека для создания виртуальных ассистентов и анализа текста, есть набор программных продуктов Intelligent Search, известный сейчас как Content AI Intelligent Search.

– Приведите примеры проектов, реализованных вашей компанией, в которых используются технологии ИИ.

20-я юбилейная клиентская конференция ЭОС «Осенний документооборот» пройдет в Москве 20 октября 2023 года. Тема осенней конференции текущего года, которую можно считать своего рода резюме обсуждений предыдущих лет, звучит соответственно: «20 лет дискуссий и споров об электронном документообороте и отечественной отрасли СЭД: цифровое настоящее, которое мы построили» (см. мероприятие раздела «ЭОС» от 20 октября 2023 г.).

– Элементы ИИ-технологий есть во многих наших проектах, если говорить об интеллектуальной обработке документов и «умном» поиске. В последние несколько лет мы реализовали ряд проектов, где с помощью AI-инструментария решались задачи классификации документов и их последующей маршрутизации. Один из наиболее «свежих», использующий актуальные технологии и возможности – это проект в Ростовской области, регионе, который для нас является площадкой для целого ряда «пилотов», а в масштабе России считается одним из субъектов-лидеров цифровизации госуправления.

В основе пилотного проекта «Обращения граждан из Электронной приемной по теме ЖКХ в Ростовской области» – разработанный нами облачный сервис для рубрицирования обращений граждан в сфере ЖКХ. При создании этого сервиса реализована нейросетевая модель классификации обращений по 25 категориям (рубрикам) и проведено обучение нейросети. Задачи, которые решает искусственный интеллект, – это опрос картотек-источников обращений, отбор относящихся к теме ЖКХ, рубрицирование их и назначение исполнителей. Система демонстрирует точность распознавания соответствующих документов на уровне более 80 % и будет совершенствоваться.

 

 

– Где еще в ближайшем будущем может начать применяться интеллектуальная обработка данных? Как это изменит процессы работы с данными?

– Конечно же, в работе с документами, но это будут уже другие технологии, качественно иные. Одним из наиболее интересных вариантов развития СЭД/ECM я вижу использование Process Mining, технологий создания цифровых двойников реальных бизнес-процессов. Очевидно, что на деле бизнес-процессы могут намного отличаться от их идеального, запроектированного варианта. Часто можно наблюдать– и в документообороте тоже – странные маршруты документов, пропуск каких-либо шагов (например, требуемого по регламенту этапа согласования), возвраты на предыдущие этапы, повторение процедур и т.д.

Process Mining позволяет не просто создавать виртуальные двойники бизнес-процессов, но и анализировать их течение, в том числе в режиме реального времени. Эта технология может использоваться для верификации разработанных сценариев бизнес-процессов и поведения пользователей, то есть для наблюдения, как они на самом деле взаимодействуют с информационной системой – при этом «испытательным полигоном» служит виртуальный двойник процесса. Цифровые двойники позволяют быстро выявить «узкие места», провести анализ «а что, если», подобрать оптимальные параметры процесса и «опубликовать» его уже в действующей системе документооборота. Использование Process Mining будет способствовать быстрому тиражированию лучших практик.

– Большое спасибо за беседу!

Тематики: Интеграция, Инновации

Ключевые слова: СЭД, электронный документооборот, ЭОС, ЭДО, Искусственный интеллект