Cognitive Technologies представила подсистему «Понимание документов» для СЭД «ЕВФРАТ-Документооборот»

Cognitive Technologies представила подсистему «Понимание документов» для СЭД «ЕВФРАТ-Документооборот», которая позволяет регистрировать документ за 3 секунды, что сокращает время регистрации по сравнению с ручным вводом в 5—10 раз.

«ЕВФРАТ-Документооборот» — первая в России СЭД, в которой реализованы принципы понимания документов. Система может сама, без участия человека, разбирать содержание документа и понимать его — выделять смысловые части. Понятая таким образом информация автоматически заносится в регистрационную карточку документа для дальнейшей работы с ним в СЭД. Подсистема понимания документов — новый уровень работы с содержанием, который позволяет качественно сократить объем рутинной работы с документами, традиционно выполняемой человеком.

В основу подсистемы «Понимание документов» легли результаты научных исследований компании в области анализа информации (синтаксический разбор, структурная модель представления знаний о языке, описание структурных связей). Кроме этого был учтен опыт, полученный в ходе создания информационных систем с модулями понимания документов для Пенсионного фонда РФ и ОАО «ММК».

Специалистами Cognitive Technologies создано XML-представление делового документа, на базе которого осуществляется обучение системы «пониманию». Подсистема «Понимание документов» может обрабатывать поступившие в электронном виде документы текстового и графического (после распознавания) форматов или документы, поступившие в бумажном виде (после сканирования и распознавания). В настоящее время система обучена пониманию тех видов документов, потребность в массовой регистрации и учете которых в организациях наиболее востребована: входящая корреспонденция и договоры по различным видам деятельности.

Для договоров подсистема «Понимание документов» автоматически заполняет в «ЕВФРАТ-Документооборот» следующие реквизиты: дату заключения, названия компаний, заключающих соглашение, предмет договора, срок действия договора, количество страниц договора, кроме этого она автоматически определяет наличие приложений и дополнительных соглашений, прикрепляя соответствующие файлы к карточке документа. Для входящей корреспонденции система заносит в карточку дату, информацию о корреспонденте (название учреждения, ФИО, должность), адресата (название учреждения, ФИО, должность), краткое содержание, количество страниц.
Подсистема «Понимание документов» доступна в рамках проектного решения при условии использования системы «ЕВФРАТ-Документооборот». Комплекс работ по внедрению включает:
- изучение вида и структуры документа;
- определение информация для «понимания»;
- создания XML-модели документа;
- обучение системы «ЕВФРАТ-Документооборот» пониманию.

Время обучения подсистемы «Понимание документов» для одного вида документов составляет около одной недели.

«В первую очередь, потенциальными потребителями продукта станут организации, придерживающиеся в своей работе ГОСТов или имеющие четкие внутренние регламенты по виду и типу используемых документов», — комментирует выпуск подсистемы «Понимание документов» руководитель направления электронного документооборота Cognitive Technologies Михаил Потапенко.
По словам вице-президента по маркетингу и общественным коммуникациям Cognitive Technologies Н. Никольского: «Сегодня развитие СЭД, как и других ИС, невозможно без активного внедрения новых технологий работы с содержанием (контентом). Ведь, несмотря на мощность современных ПК, они до сих пор не могут решать огромное количество задач, связанных с интеллектуальной обработкой информации, интуитивно понятных человеку. Понимание документов в СЭД «ЕВФРАТ-Документооборот» — первый, но очень важный шаг на пути массового распространения технологий контентного документооборота».

В планах по развитию возможностей понимания документов в СЭД «ЕВФРАТ-Документооборот» стоит обеспечение более глубокой интеграции технологий понимания в систему для организации процессов движения документов и контроля исполнения, внедрение самообучающихся алгоритмов понимания, подключение нового аппарата морфологического разбора и анализатора структурных связей, разрабатываемых в лабораториях компании.

Автор: Александр Абрамов.

Тематики: Интеграция

Ключевые слова: интеграция, Cognitive Technologies, СЭД, электронный документооборот