В сентябре 2021 года в госорганах Якутии тестово заработала система классификации документов в Единой системе электронного документооборота (ЕСЭД) на основе нейронных сетей. Проект курируют министерство инноваций, цифрового развития и инфокоммуникационных технологий РС (Я) совместно с Республиканским центром инфокоммуникационных технологий (РЦИТ), сообщили ИА YakutiaMedia в пресс-службе Мининноваций.
ЕСЭД работает в Якутии с января 2019 года, сейчас в неё включены 37 органов государственной власти республики, 445 органов местного самоуправления, все госучреждения и большая часть муниципальных учреждений.
Каждый день в системе создается 3,6 тысячи документов, 1,7 тысячи РКПД и 9,5 тысяч поручений. Объем базы данных составляет 5,2 Тб и растет на 1,9 Тб в год.
Итоги первого месяца обучения нейросети были представлены в Москве, на Всероссийской конференции "Осенний документооборот — 2021".
Петр Николаев, заместитель министра инноваций, цифрового развития и инфокоммуникационных технологий РС (Я):
— Выбирая бизнес-процесс для внедрения нейросетей, мы остановились на распределении входящих документов по исполнителям. С одной стороны, обработка входящей корреспонденции — это рутинная, однообразная работа, но в то же время, определение сути вопроса в документе, и кто его решает, требует определённых знаний от специалиста и времени на изучение документа. Кроме того, входящие документы — это неструктурированная информация, тексты в документах совершенно различного содержания, поэтому стандартные алгоритмы либо бессильны, либо должны быть чрезмерно сложны, в решении задачи распределения документов. Распределение документов по отделам — с точки зрения нейронной сети — задача классификации. В нашем случае нейронная сеть должна классифицировать входящие документы по отделам, ускоряя прохождение документов до конечного исполнителя.
Для обучения моделей нейросети разработчики использовали входящие документы министерства инноваций РС(Я) и документы РЦИТ, начиная с января 2019 года. В общем получилось почти 20 тысяч документов с PDF-файлами.
После обучения для оценки работы нейросети в РЦИТ было собрано 550 проектов поручений за сентябрь и начало октября для сравнения исполнителей, выбранных нейросетью и человеком.
В 71% случаев нейросеть смогла дать ответ, к какому отделу относится документ. Из них 58% ответов полностью совпадали с выбором человека, и еще 22% частично совпадали. 20% процентов ответов не совпадали.
Средняя точность ответов составила 76%, а полнота — 68%. Это, как полагают разработчики, связано с неравномерным распределением объема документов по отделам.
В министерстве инноваций проанализировали результаты по 219 проектам поручений за период с 11 по 20 октября. Нейросеть выбрала исполнителей в 84% случаев.
58% ответов полностью совпадали с выбором человека, и еще 28% частично совпадали. 14% процентов ответов не совпадали. Средняя точность и полнота для министерства не рассчитана.
Петр Николаев:
— Внедрение нейросети — процесс не быстрый, но уже мы видим неплохие результаты. Работа будет продолжаться в нескольких направлениях, в том числе на увеличение точности и полноты классификации, учёт реорганизаций в обучении нейросети.