Cognitive вернул к жизни OCR Cuneiform. В открытом коде

01.10.2008 |

Александр Янкевич

Разработчик Cognitive Technologies завершает проект OpenOCR по раскрытию исходных кодов и портированию своей системы оптического распознавания текста Cuneiform под соответствующие ОС – Linux и FreeBSD. Развитие Windows-версии программы Cuneiform было прекращено около 8 лет назад, и, возродив ее в открытом коде, Cognitive Technologies получает возможность зарабатывать на ней за счет сервиса и технической поддержки – стандартной бизнес-модели, которая используется в сегменте СПО.

Система оптического распознавания текстов OCR Cuneiform в свое время была одним из флагманских продуктов Cognitive Technologies и конкурировала с другой лидирующей платформой российского разработки ABBBYY Finereader.Однако через некоторое время после кризиса 1998 года компания решила прекратить развитие этой линейки, включив, впрочем, функционал Cuneiform в свою промышленную систему Cognitive Forms, которая предназначена для ввода и обработки различных документов – анкет, платежных требований и поручений, счетов-фактур, заявлений на выдачу кредитных карт и т.д.

Однако в конце прошлого года разработчик анонсировал программу «Распознавание должно быть на каждом компьютере», которая предполагает раскрытие исходных кодов Cuneiform и, соответственно, перевод ее в разряд свободно распространяемого ПО. Первым шагом в реализации этой программы стал перевод OCR Cuneiform в разряд бесплатной (freeware) и открытие кодов ядра распознавания системы, то есть ее интеллектуальной начинки. Как отметил руководитель направления СПО Cognitive Technologies Владимир Арлазаров, это не было тривиальным процессом: не считая того, что в свое время разработка Cuneiform не предполагала портирование под другие операционные системы, у компании достаточно много времени заняла патентная и лицензионная очистка кода программы.

На втором этапе, после открытия исходных кодов ядра распознавания Cuneiform, сообществом СПО буквально за пару месяцев была успешно решена задача портирования системы под Linux (сейчас также существует и версия под FreeBSD). Интересно, что инициировали этот процесс представители западного сообщества СПО. В дальнейшем у проекта появилась волонтерская команда из примерно 6 разработчиков, включая российских специалистов, которая занималась портированием. Представленная ими Linux-редакция ядра Cuneiform поддерживает работу с 64-битными приложениями, дает возможность экспорта результатов распознавания в формате HTML с сохранением форматирования оригинала (выделение жирным, курсивом и т.д.) и может быть установлена в любом дистрибьютиве Linux соответствующем стандарту LSB (Linux Standard Base).

И, наконец, третий шаг, который Cognitive Technologies анонсировала вчера, 30 сентября, - компания открыла исходные коды интерфейса системы распознавания текстов OCR Cuneiform. Если открытые коды ядра распознавания ориентированы в основном на разработчиков и системных программистов, которые могут встраивать технологии OCR в свои программные продукты, то после открытия кодов интерфейса домашние и корпоративные пользователи могут самостоятельно собрать и использовать OCR-систему полностью из открытых кодов. Здесь также компания прошла стадию лицензионной очистки. Кроме этого, как отмечают представители Cognitive Technologies, публикация исходных кодов интерфейса позволит расширить круг участников проекта OpenOCR. Теперь разработчики сообщества Open Source получат возможность наряду с развитием функциональных возможностей вносить улучшения в текущий и создавать новые пользовательские интерфейсы системы. «Теперь же есть все основания полагать, что, с открытием интерфейса, до конца 2008 года можно ожидать появления системы распознавания текстов с открытым исходным кодом, ориентированной на конечных пользователей, работающих в наиболее распространенных в мире ОС», - прокомментировал Владимир Арлазаров. Всего за время проекта было зафиксировано более 700 тыс. скачиваний.

Финальной целью проекта является получение промышленной системы, которую могли бы использовать как домашние, так и корпоративные пользователи, включая интеграцию OCR с промышленными системами. На западном рынке есть системы OCR под Linux, однако они не поддерживают русский язык. Кроме того, как утверждают в Cognitive Technologies, OpenOCR – первая в мире система такого уровня (в частности, с поддержкой 22 языков и другим унаследованным функционалом от Cuneiform). При этом одновременно с открытием кодов Cognitive Technologies приступила к работам по созданию веб-сервиса, предоставляющего возможность распознавания текстов в сети Интернет без установки программного обеспечения на локальный компьютер.

Компания уже продемонстрировала имеющиеся результаты проекта – была показана работа OCR-комплекса, собранного из кодов ядра распознавания, под управлением ОС Linux. Примечательно, что система работает быстрей своего Windows-аналога. В дальнейшем разработчик планирует зарабатывать по традиционной в сегменте СПО бизнес-модели: пользователи получают программу бесплатно и оплачивают дополнительные услуги по ее сопровождению, поддержке, модификации и т.д. Объем мирового рынка свободного ПО, по данным аналитической компании Saugatuck Technology, к 2010 году составит $22 млрд при ежегодном росте в 30 %. По данным исследовательского центра «Финам», рынок свободного ПО в России составлял на конец прошлого года около $40 млн (при этом, по оценкам экспертов, в России количество «линуксоидов» сейчас превышает 500 тыс. человек). К 2010 году эта цифра достигнет $200 млн.

Доля Cognitive Technologies к 2010 году может составить 5-7 % за счет оказания услуг, технической поддержки и рекламы. По прогнозам разработчика, число активных пользователей систем распознавания (тех, кто используют OCR не реже 1 раза в месяц) за счет использования Open Source к 2010 году может возрасти в 5 раз, во многом за счет активного подключения к использованию OCR офисных сотрудников, учащихся школ, студентов вузов, а также государственных структур, для которых бесплатное ПО станет альтернативой нелицензионным продуктам. Таким образом, число пользователей OCR к этому периоду времени может составить порядка 25 млн человек (сегодня это число составляет около 5 млн человек). Также Cognitive намерена использовать OpenOCR в своих академических программах, и это будет не первой инициативой такого рода (см., например, новость раздела СЭД от 26 июня 2008 г.).

Как говорят эксперты, Cognitive Technologies пошла по тому же пути, который использовали некоторые западные компании, которые реанимировали свои продукты за счет перевода их в разряд freeware и далее СПО, в частности, так поступил Netscape, который выпустил браузер Mozilla Firefox. Можно также отметить, что популярный пакет OpenOffice основан на открытых кодах StarOffice от компании Sun Microsystems.

В целом интерес к СПО в России растет. Как, в частности, прокомментировал директор по развитию GNU/Linuxcenter Александр Жмурко: «Постепенно ПО с открытым кодом становится все более востребованным бизнес-средой. Зачастую ограничения его распространения связаны с отсутствием по ряду направлений автоматизации программ, пригодных для промышленного использования. В частности, это касалось и отсутствия достойных OCR-продуктов, работающих в среде Linux». Сейчас компания Linuxcenter рассматривает возможность включения OpenOCR в дистрибьютивы ОС, которые она распространяет.

Из других недавних инициатив, связанных с появлением промышленных продуктов в сегменте российского СПО, можно вспомнить вывод на рынок компанией «АйТи» Compiere ERP разработки одноименной американской компании. Кроме того, «АйТи» сотрудничает и с Sugar CRM, которая также имеет открытую версию. «Преимущества использования СПО для корпоративных пользователей очевидны. Для покупателя всегда есть определенный барьер на пути к построению классической корпоративной информационной системы в виде большого бюджета, однако, используя открытый код, можно выиграть за счет существенной экономии при внедрении. Поэтому продукты на базе СПО могут найти в России спрос – если у них будет в наличии функционал, который покроет российскую специфику, и качественная поддержка», - прокомментировали в «АйТи».

Подробности

Компания Cognitive Technologies создана на базе лаборатории искусственного интеллекта Института системного анализа РАН (бывший ВНИИСИ АН СССР). С 1968 года сотрудниками коллектива было реализовано более 3 тыс. проектов по созданию и внедрению информационных комплексов, автоматизированных систем управления и операционных систем в органах государственной власти и на крупных промышленных предприятиях. В частности, компанией созданы программы «КАИССА» (первый чемпион мира по шахматам среди компьютерных программ) и СУБД ИНЕС, насчитывающая более 2,5 тыс. инсталляций в стране и в мире. Основным продуктом Cognitive Technologies является система электронного документооборота «ЕВФРАТ-Документооборот», другие предложения разработчика - Cognitive Forms Bank, информационно-аналитическая система «Астарта», система обработки документов, удостоверяющих личность, Cognitive Passport, система массового ввода страховых полисов ОСАГО Cognitive Megapolis, система дистанционного обучения «CT Курс» и др.