Текстовый анализ обрел самостоятельность. RCO пустилась в свободное плавание

Из состава «Гарант-Парк-Интернет» выделилось подразделение RCO (Russian Context Optimizer), занимающееся текстовым поиском и анализом, которое теперь стало самостоятельной и независимой компанией – ООО «ЭР СИ О». Основная причина для такого шага – рост соответствующего сегмента рынка и намерения RCO более активно работать на нем.

С момента образования в 1995 году «Гарант-Парк-Интернет» специализируется на разработке и развитии коммерческих информационных проектов. Компания имеет следующие направления деятельности: разработка многофункциональных решений - интернет-сайтов, интранет, экстранет систем, информационно-поисковых систем. Эти функции берет на себя подразделение Metric. За размещение, поддержку, предоставление в аренду программного и аппаратного обеспечения, предоставление услуг телекоммуникационного узла отвечает Parking.ru. Разработкой настраиваемых систем бизнес управления для интернет/интранет, системы управления контентом, системы электронной коммерции занимается Optimizer. Продукт Optimizer предназначен для разработки сайтов и предоставляет инструмент для последующего сопровождения (публикация документов, развитие структуры сайта и управление интерактивными сервисами). Также на рынке представлен Commerce.Optimizer - готовое полнофункциональное решение для моделей «интернет- магазин» или «корпоративная система для дилеров» и т.д.

Также одним из исторических направлений деятельности компании «Гарант-Парк-Интернет» являлась разработка средств полнотекстового поиска и анализа неструктурированной информации, продукция которой продвигалась под брендом RCO (Russian Context Optimizer). Под этой маркой сейчас представлена линейка продуктов для поиска и анализа текстов для Oracle и Microsoft, а также поисковая машина Russian Context Server, которая осуществляет контекстный и реляционный поиск, созданная в научно-исследовательской лаборатории RCO Research Group. Напомним, что компания «Гарант-Парк-Интернет» является технологическим партнером компаний Microsoft и Oracle и обладает статусами Microsoft Certified Partner, Oracle Certified Partner. В семейство продуктов для организации полнотекстового поиска с учетом морфологии русского языка Russian Context сейчас входят адаптированные версии существующих поисковых систем: Oracle Text - RCO for Oracle, Microsoft full-text Search - RCO for BackOffice, а также собственная поисковая машина.

Как сообщили в компании RCO, к моменту ее выхода из состава «Гарант-Парк-Интернет» уже фактически сложились независимые технологические процессы и сформировалась собственная клиентская база, поэтому было принято решение о начале самостоятельной работы. «Существование в рамках одной компании нескольких подразделений с существенно различающимися видами деятельности не оптимально, как с точки зрения продвижения на рынке, узнаваемости бренда, так и по прозрачности и привлекательности для потенциальных инвесторов»,- прокомментировал генеральный директор ООО «ЭР СИ О» (RCO) Владимир Плешко.

С исторической точки зрения коллектив RCO начал формироваться в 1996 году. Первыми проектами стали создание информационной системы «Парк» и интернет/интранет версии справочно-правовой системы «Гарант». В 1997 году начались разработки первых продуктов. Это была поисковая машина Russian Context Server, а также RCO for Oracle - пакет для разработки информационно-поисковых систем на платформе СУБД Oracle. С 1999 года RCO начал активно заниматься не только поиском, но и анализом текстовой информации. «Фактически мы создали внутри компании научно-исследовательское подразделение, которое работает и сейчас (более 50 научных публикаций, активное участие в профильных научных мероприятиях - конференция «Диалог», семинар РОМИП)»,- прокомментировал Владимир Плешко. Тогда специалисты RCO начали с исследований методов ассоциативно-статистического анализа текста, экспериментировали с разными подходами к навигации в коллекциях текстовых документов. Бал также создан отдельный сайт, который был посвящен исключительно продукции RCO. Вскоре специалисты пришли к выводу, что без активного использования методов компьютерной лингвистики, где помимо математических методов, используются знания о языке, невозможно создать продукт надлежащего качества. Последующий 2000-й год можно считать стартом RCO как отдельного направления внутри «Гарант-Парк-Интернет». Специалисты начали работать над созданием ядра анализатора текста. В составе «Гарант-Парк-Интернет» RCO выполнял функции развития технологий, создания и реализации ПО в области поиска и анализа текстовой информации. В подразделении работало порядка 10 разработчиков и менеджеров. Постепенно был создан комплекс технологических компонентов и программных продуктов, позволяющих решить достаточно много задач, связанных с интеллектуальным анализом текста.

Как отмечают в RCO, на тот момент на рынке никто не говорил о синтактико-семантическом анализе текста, извлечении информации из текста, фактографическом поиске, хотя существовали компании, занимающиеся компьютерной лингвистикой. Например, зарубежная Systran с главным офисом в Париже, начавшая свою работу по машинному переводу с 1968 года, уже хорошо себя зарекомендовала к тому времени. Также существовала система Trados. На российском рынке работали в основном два игрока – «Диалинг» и «АОТ». В RCO при разработке коммерческого продукта исходили из задач информационного поиска и предложили рынку ПО, решающее такие задачи как построение содержательного портрета текста, выявление упоминаний о персонах и организациях, построение семантической сети, поиск и классификация фактов, определение тональности текста.

Сейчас, после отделения от компании «Гарант-Парк-Интернет», в сферу деятельности RCO входят также компьютерная лингвистика и интеллектуальная обработка текстовой информации. Специалисты компании, штат которой насчитывает около 20 человек, проводят научные исследования, разрабатывают программное обеспечение и реализуют коммерческие проекты. Правда, пока проектную деятельность компания ведет только в Москве. В регионах и других странах привлекаются партнеры. Например, в Петербурге –это ЗАО «Ливс» (ведущий местный технологический партнер Oracle), в Белоруссии – Todes Ltd. Кроме того, есть и партнеры, работающему по всему СНГ, это, например, Softline.

Среди последних проектов RCO можно отметить внедрение решений для Банка России и ОАО «Газпром». Также на данный момент близятся к завершению два интернет-проекта. Один идет в рамках разработки новостного сайта по ИТ-тематике совместно с компанией, входящей в крупный медийный холдинг (имя не раскрывается). Второй включен в инновационный проект, реализующий новый подход к поиску информации. Здесь подробности также не разглашаются. Среди других клиентов RCO – «Тюменская Нефтяная Компания» - один из лидеров в нефтедобывающей отрасли. Для нее RCO осуществляла поставку технологий поиска для создания аналитического поискового механизма, позволяющего анализировать информационные потоки и осуществлять полнотекстовый поиск и анализ текста. Также продуктами RCO пользуются такие крупные заказчики как «МДМ-Банк», «Альфа-Банк», «Итар-Тасс», ФСБ и другие.

Прямая реклама по продвижению бренда RCO и его технологий, по мнению специалистов компании, на данном рынке не работает, поэтому RCO реализует «образовательную» стратегию – участвует в конференциях, проводит семинары, публикует статьи. «Сейчас речь идет не столько о продвижении RCO на рынке, сколько о продвижении самой идеи этого рынка. Кроме того, мы традиционно делаем ставку на партнерскую сеть, выстраивая взаимовыгодные отношения с крупнейшими поставщиками и интеграторами. В качестве успешного примера хотелось бы отметить наше многолетнее сотрудничество с группой «ФОРС»,- прокомментировал Владимир Плешко. Напомним, что RCO была привлечена как партнер при разработке продукта ROSES (корпоративная поисковая система, созданная на базе соответствующей технологии от Oracle - Secure Enterprise Search 10g), который сейчас продвигает «ФОРС – Центр разработки» (см. новость от 16 октября 2007 г.). В 2008 году компания RCO планирует предложить корпоративным заказчикам в России три новых программных продукта. Подробности здесь пока не разглашаются. Также в планах разработчика завершить перенос технологий RCO на английский язык и начать создание анализаторов текста еще для нескольких языков. Говоря о развитии компании с количественной точки зрения, то в 2008 году RCO, по словам ее представителей, планирует остаться в рамках малого предприятия (до 50 человек).

Напомним, что помимо RCO на российском рынке функционируют и другие компании, работающие в аналогичных направлениях. Компания «Промт», по мнению аналитиков, занимает около 90 % рынка машинного перевода в России, причем его позиции сильны не только у нас, но и в Европе. Также ранее, лет 5 назад, система «Сократ» уверенно конкурировала с «Промт», более того, обе этих компании вышли из одной питерской лаборатории, но на сегодняшний день «Сократ» сдал позиции. Компания «Арсеналъ» (создатель «Сократа») по некоторым данным готовит новую версию системы машинного перевода, на порядок превосходящую аналоги. Кроме коммерческих машинных переводчиков, есть и академические. Среди них англо-русская система «Этап», которая дала начало научному направлению, ставшему основным в российских академических разработках машинного перевода. Еще одна рабочая группа Aot.ru разрабатывает программное обеспечение в области автоматической обработки текста. В круг интересов этой компании в основном входит анализ русского языка. Начиная с 2002 года Aot.ru выкладывает разработки на базе лицензирования по схеме LGPL.

Рубрики: Интернет, Интеграция, Маркетинг, ПО

Ключевые слова: методы программирования, программирование, системное программирование, договор программное обеспечение, Интернет программное обеспечение, использование программного обеспечения, классификация программного обеспечения, надежность программного обеспечения, поставка программного обеспечения, прикладное программное обеспечение, программное обеспечение, программное обеспечение Microsoft, программное обеспечение виды программного обеспечения, программное обеспечение компьютера, программное обеспечение лицензия, программное обеспечение продажа, программное обеспечение управления, проектирование программного обеспечения, разработка программного обеспечения, рынок программного обеспечения, система программного обеспечения, системное программное обеспечение, тестирования программного обеспечения, установка программного обеспечения, назначение операционной системы, Windows, внедрение, разработки , разработка программ, центр разработки, база данных, Microsoft, Майкрософт, Oracle