Анна, расскажите о том, как возникла идея создать поисковик, ориентированный на поиск визуального контента?
- На самом деле идея заключалась в создании качественного поисковика, который отвечал бы современным реалиям Интернета. А они таковы, что сейчас в Сети появляется все больше визуального контента, увеличивается количество пользователей с широкополосным доступом, а значит, появляется спрос на поиск соответствующей информации.
Но это не было единственным ориентиром при разработке GoGo.ru. Мы также стремились к тому, чтобы поисковик имел высокую релевантность результатов поиска за счет использования инновационных алгоритмов лексического анализа и других инструментов. Отдельное внимание уделялось тому, чтобы GoGo.ru был защищен от современных угроз качеству выдачи, таких как поисковый спам. Нам удалось решить эту проблему достаточно успешно потому что, к моменту разработки GoGo.ru все приемы так называемых «черных оптимизаторов» уже были известны, и в отличие от других поисковиков, мы смогли изначально предусмотреть способы противодействия некорректным способам продвижения.
Почему Mail.ru призналась в авторстве GoGo.ru только спустя некоторое время после запуска ресурса?
- На самом деле, компания Mail.ru и не скрывала, что является владельцем проекта GoGo.ru. Копирайт нашей компании мог увидеть на главной странице поисковика любой посетитель с момента запуска. Другое дело, что мы не стали создавать шумиху вокруг появления GoGo.ru, так как поисковик находится в стадии бета-тестирования. Наружная реклама, а также реклама проекта в Интернете, прессе и на ТВ появилась примерно через месяц после открытия сервиса.
Расскажите, как происходила разработка проекта - до запуска бета-версии летом этого года: Когда она началась? Какие этапы можно выделить? Когда точно ресурс появился в Сети?
- Разработка GoGo.ru началась весной 2006 года на основе уже имевшегося поискового движка, использовавшегося для поиска по проектам Mail.ru. Осенью 2006 года мы запустили своего поискового робота, который был быстро замечен владельцами сайтов и SEO-специалистами, положив, таким образом, начало «публичной» истории нашего поисковика. Бета-версия GoGo.ru официально увидела свет 18 июня 2007 года. На самом деле, сайт был открыт на несколько дней раньше, 14 июня, и слухи о нем очень быстро распространились по Сети.
Кто работает над проектом GoGo.ru – наверняка в компании Mail.ru выделена специальная группа? Почему в качестве руководителя проекта было решено пригласить Михаила Костина – как быстро он заинтересовался этой идеей и принял приглашение? Планируете ли Вы в будущем создать дочернюю компанию GoGo.ru?
- Разработкой и развитием GoGo.ru занимается команда программистов и верстальщиков, которую внутри компании называют Search Team, под руководством Михаила Костина. Периодически привлекаются и другие разработчики Mail.ru.
Тем, кто начинает разработку поисковой системы, приходится решать серьезную проблему – многие важные тонкости разработки поисковика, в особенности связанные с качеством поиска, нигде не описаны, так как соответствующая информация у реальных крупных проектов является закрытой, а академические исследования сильно оторваны от реальности. Поэтому приглашение в команду человека, руководившего разработкой поисковой системы «Апорт», качество поиска которой в свое время оценивалось экспертами как достаточно высокое, было вполне естественным шагом. В тот момент речь шла только о разработке собственного многоцелевого поискового движка, а решение о разработке поисковой системы для Интернета еще не было принято. Это стало одной из причин, по которой переговоры получились достаточно длительными. Однако в итоге нам удалось убедить Михаила в перспективности нашего предложения. Просто GoGo.ru - это действительно очень интересный проект.
Пока мы не планируем создавать дочернюю компанию, которая занималась бы развитием поисковика, так как все связанные с GoGo.ru задачи достаточно успешно и эффективно решаются в рамках Mail.ru.
Какие технологии поиска используются при создании GoGo.ru? Вы говорите об уникальных возможностях лексического анализа – в чем их особенность по сравнению с лексическим анализом, например, «Яндекса»?
- Анализ запроса – зона нашего особого внимания. Мы умеем автоматически исправлять опечатки, искать в обоих написаниях – кириллическом и латинском, включая названия зарубежных брендов, распознавать различные варианты слов с неустоявшимся написанием. GoGo.ru «знает», что некоторые слова в запросе, такие как географические термины, или, например, слово «сайт», необходимо обрабатывать особым образом. Так, если пользователь вводит запрос «сайт Аэрофлота», то он с 99%-й вероятностью хочет увидеть в первой строке результатов поиска корпоративный ресурс авиакомпании, а не какую-то веб-страницу, на который имеются расположенные недалеко друг от друга слова «сайт» и «Аэрофлот».
Также у нас используются лингвистические и статистические методы для определения степени связанности различных слов в запросе, реализован интеллектуальный алгоритм распознавания стоп-слов (союзов, предлогов и т. д.). Некоторые из наших разработок в этой области уникальны, другие имеют аналоги, однако проводить сравнение с кем-то конкретно достаточно сложно, так как подробная информация об используемых алгоритмах, как правило, не публикуется.
Кроме того, нам удалось создать систему автоматического распознавания типа веб-источника: информационный, коммерческий или пользовательский (форумы и блоги). Так что пользователь может отфильтровать выдачу в соответствии со своими нуждами. Эта наша уникальная разработка, которая показывает весьма неплохие результаты. Свой инструмент фильтрации есть и в поиске по картинкам, где наша система позволяет автоматически отделять в найденных результатах фотографии от прочих изображений.
Вы упоминали о том, что GoGo.ru развивает направление обработки поискового запроса по синонимам – расскажите, пожалуйста,обэтом подробнее?
- Идея заключалась в том, чтобы позволить пользователю получать наиболее полные результаты поиска по интересующей теме, даже если он сделал не самый удачный запрос. Сейчас в словаре синонимов GoGo.ru насчитывается около 5 тыс. слов, и их количество каждый день растет. Мы условно разделяем синонимы в словах запросов на три группы.
Во-первых, это зарубежные бренды, имена компаний и аббревиатуры, которые могут писаться, как на русском, так и на оригинальном языке. Например, к этой группе относятся «крайслер» и «chrysler», «тошиба» и «toshiba», «смс» и «sms», «леруа мерлен» и «leroy merlin». Во-вторых, GoGo.ru распознает слова с неустоявшимся написанием, и при получении запроса с таким словом, производит поиск по всем распространенным вариантам. Тут можно отметить слова «каратэ» и «карате», «фитнес» и «фитнесс», «он лайн» и «онлайн», «шопинг» и «шоппинг». И, наконец, в-третьих, система обрабатывает часто встречающиеся опечатки. Поиск в этом случае производится и по ошибочному, и по правильному написанию, но документы с правильным вариантом получают больший вес при ранжировании. К распространенным ошибкам относятся, например, «котедж» вместо «коттедж», «дешовый» вместо «дешевый», «линолиум» вместо «линолеум» или «olimpus» вместо «olympus».
Нашим разработчикам удалось придумать достаточно интересную схему пополнения словаря синонимов. Очевидно, что пользователи нередко по очереди делают запросы различных слов с одинаковым смысловым значением (те же «крайслер» и «chrysler»), чтобы отыскать больше информации. Поэтому в GoGo.ru автоматически анализируются запросы одного пользователя, сделанные в ограниченном временном интервале. Полученный список потенциальных синонимов проходит модерацию человеком, который оставляет только подходящие группы слов для пополнения словаря.
Как Вы решили вопрос с поисковыми спамерами и черными оптимизаторами – в чем здесь заключается удобство для пользователя?
- Как я уже говорила, при разработке GoGo.ru создатели уже имели возможность проанализировать деятельность «черных оптимизаторов» и учесть существование таких угроз, как поисковый спам, дорвеи, накрутка ссылочного веса и т.д. непосредственно при создании алгоритмов поиска. Многие другие поисковики, которые были запущены еще до того, как проблема поискового «мусора» обрела нынешнюю актуальность, вынуждены как-то приспосабливать свои движки к современной ситуации, грубо говоря, ставить заплатки. Конечно, им сложнее вести эту борьбу с оптимизаторами, действующими не самым честным образом.
Какие ресурсы преимущественно Вы индексируете? Как быстро пополняется база GoGo.ru?
- Мы индексируем русскоязычные ресурсы по всему интернету, а также все ресурсы в домене .ru, .ua, .by, .su. Частота обновления сайтов зависит от ряда факторов, в первую очередь от наших внутренних данных об авторитетности данного сайта.
На какую целевую аудиторию Вы ориентируетесь? Какова посещаемость GoGo.ru сейчас и на какой показатель Вы рассчитываете в ближайшее время?
- Мы относим к целевой аудитории всех русскоязычных пользователей Сети. Все-таки поиск в Интернете – это довольно универсальный сервис. В настоящее время ежедневно GoGo.ru пользуется около 50 тыс. человек. Мы рассчитываем на то, что эта цифра продолжит увеличиваться в геометрической прогрессии. В этом нам помогут, как дальнейшая разработка сервиса, так и маркетинговые усилия, и общие тенденции рынка, такие как рост интернет-аудитории и заметное увеличение интереса к онлайн-видео. Сейчас каждый четвертый запрос в GoGo.ru приходится на поиск по видео.
Опишите развитие проекта с момента запуска – какие новые сервисы появились к сегодняшнему моменту? Почему были выбраны именно они?
- Прежде всего, достигнут существенный прогресс по количественным показателям. С момента открытия в июне более чем в 2 раза увеличилась индексная база. Сейчас GoGo.ru ищет по 2 млрд веб-документов, 130 млн картинок и 1,15 млн. видеороликов. К моменту запуска мы осуществляли поиск по семи видеохостингам. Сейчас их количество выросло до одиннадцати: «Видео@Mail.ru», ruTube, LoadUp, Rambler Vision, Video.I.UA, MyВи, LiveInternet, Teledu, BigMir.net, YouTube и Metacafe.
С 20 августа на базе оптимизированного под мобильную специфику движка GoGo.ru был запущен поисковик по WAP-ресурсам (wap.gogo.ru), позволяющий искать информацию по более чем 45 тыс. WAP-сайтов. Примерно тогда же, как уже говорилось, мы использовали движок GoGo.ru для запуска поиска по видео на Mail.ru.
В начале сентября была внедрена новая система анализа поисковых запросов для автоматического отбора потенциальных синонимов, которая позволила увеличить скорость пополнения словаря.
Осенью мы приступили к работе по раздаче нашего поиска веб-мастерам. Все желающие могут установить себе на сайт понравившуюся поисковую форму из каталога (www.gogo.ru/wmaster/form/). А для тех, кого интересует возможность встраивания поисковой строки и списка результатов поиска, в соответствии с имеющимся на сайте дизайном, в настоящее время планируется запуск XML-поиска. Пока данная услуга предоставляется индивидуально, но вскоре будет доступна через обычную регистрацию. Раздавая свой поиск всем желающим, мы поможем большему числу пользователей узнать о GoGo.ru и оценить качество работы поисковика.
Также недавно нами была запущена XML-синдикация фотохостингов. То есть с этих ресурсов к нам каждый день поступают XML-файлы с информацией о загруженных за сутки изображениях. Это дает нам возможность получать наиболее полную информацию по каждой проиндексированной картинке, ну, и, разумеется, повышает скорость индексации. Мы уже работаем с такими ресурсами, как «Фото@Mail.ru», LiveInternet.ru, 500px.com, Flamber.ru, 35Photo.ru, PhotoForum.ru, Keep4U.ru, AutoWP.ru и Fota.Mota.ru. Кстати, новые возможности поиска по фотографиям будут базироваться как раз на основе XML-синдикации.
Расскажите подробнее об этом проекте - сервис предполагает, что пользователи смогут сами посылать XML-рапорты об обновлениях на собственных фоторесурсах в базу GoGo.ru – планируете ли Вы как-то фильтровать этот контент? По каким параметрам?
- Да, фотохостинги могут не дожидаться, пока наш робот проиндексирует их «в общем порядке». Что касается, фильтрации, то в XML-шаблоне предусмотрен такой параметр, как «взрослое» фото. При выдаче этих картинок в результате поиска вместо уменьшенного изображения в превью помещается предупреждающий знак. Общими требованиями ко всем поступающим по XML картинкам и видеороликам являются доступность незарегистрированному пользователю, отсутствие оплаты за просмотр и соответствующее законодательству РФ содержание. При несоблюдении этих правил контент удаляется из базы.
Mail.ru анонсировал запуск сервиса XML-поиска – в чем его суть и основное отличие от аналогичного сервиса компании «Яндекс»?
- Мы даем веб-мастерам возможность с помощью простого скрипта наладить автоматическую отправку поисковых запросов на GoGo.ru и получать ответы в формате XML-файла. При этом мы не накладываем ограничений на коммерческое использование и разрешаем делать до 10 тыс. запросов в сутки. Единственное, что мы взамен будем просить от веб-мастеров - это разместить наш логотип рядом с поисковой строкой или установить ссылку на GoGo.ru на странице с результатами поиска.
Новые сервисы GoGo.ru предполагают участие пользователей - можно ли говорить, что GoGo.ru развивается в сторону социального ресурса, где пользователи смогут самостоятельно формировать контент?
- Это не совсем так. Во-первых, к «социальным» в поисковой индустрии принято относить проекты, в которых пользователи как-то влияют на результаты поиска или сами отвечают на вопросы других пользователей. GoGo.ru – это все же идеологически и технически другой проект, а к социальному поиску ближе «Ответы@Mail.ru», в которых сейчас насчитывается 69 миллионов ответов на 10 миллионов вопросов. GoGo.ru, кстати, осуществляет поиск по базе этого сервиса. Во-вторых, своего контента у GoGo.ru нет. Мы просто индексируем данные в Интернете. Хотя, разумеется, не можем игнорировать возрастающие объемы UGC (user-generated content) в Сети и разрабатываем специальные поисковые инструменты для более полной и оперативной индексации «народного» контента. XML-синдикация, как раз, служит примером такого инструмента.
Какова коммерческая модель проекта GoGo.ru?
- В первую очередь, разумеется, мы планируем зарабатывать на контекстной рекламе. Это оптимальная и неоднократно проверенная на практике бизнес-модель для поискового сервиса, которая учитывает интересы, как владельца поисковика, так и рекламодателя, и пользователя.
На какие проекты – российские или зарубежные – Вы ориентировались при создании GoGo.ru? Какие поисковики Вы можете назвать конкурентами?
- Мы сознательно отказались от идеи делать клон какого-либо из уже существующих сервисов. На мой взгляд, такое подражание изначально обрекает проект на репутацию вторичного продукта, которому суждено тихо функционировать в тени оригинала. И, кажется, нам удалось создать достаточно уникальный сервис.
Конкурентами можно назвать все поисковые сервисы, ориентированные на русскоязычный поиск. Это в первую очередь, конечно, относится к текстовому поиску. А вот видео по Рунету пока никто, кроме GoGo.ru, не ищет.
Сегодня в Рунете существует много альтернативных поисковых систем, таких как: «Квинтура», «Нигма», «Визуальный мир», «Вебальта» - которые стремятся найти новый удобный метод поиска в сети - как Вы позиционируете себя на этом фоне? Какую нишу на рынке поисковых систем Рунета Вы намерены занять?
- Мы стараемся не увлекаться излишней визуализацией результатов поиска, облаками тегов и прочими, по сути, второстепенными вещами, так как все эти функции вряд ли можно назвать чрезвычайно полезными для среднего пользователя, стремящегося отыскать в Сети необходимую информацию. Необходимости в мета-поиске (сборе результатов поиска с нескольких поисковиков) у нас тоже нет, так как качество работы собственного движка GoGo.ru и имеющейся индексной базы достаточно высоко оцениваем не только мы, но и независимые экспертные компании. Недавно мы получили еще одно доказательство признания экспертов. GoGo.ru победил в конкурсе «Продукт года» на выставке SofTool 2007, получив первое место в номинации «Интернет-технологии».
Что касается какой-то отдельной ниши, то мы не считаем, что возможности нашего поисковика позволяют ему претендовать лишь на какой-то специфический участок рынка, например, поиск по видеоресурсам, и рассчитываем потеснить конкурентов по всему спектру поисковых направлений.
И последний вопрос, прокомментируйте, пожалуйста, насколько идея поиска визуального контента сегодня актуальна в Рунете?
- Ниша поиска визуального контента в Рунете крайне актуальна. Мы наблюдаем активный пользовательский спрос в этой сфере. Объем контента на видеохостингах, фоторесурсах и других UGC-проектах непрерывно увеличивается, причем очень быстрыми темпами. Мы имеем возможность непосредственно оценивать этот процесс на примере наших проектов «Видео@Mail.ru» и «Фото@Mail.ru». Да и количество таких сервисов постоянно растет. Думаю, что GoGo.ru может претендовать на то, чтобы стать навигатором пользователя во всем этом многообразии визуального контента.
Подробности
Артамонова Анна Викторовна родилась 30 апреля 1978 года в Москве. Окончила институт журналистики и литературного дела. Всю сознательную жизнь работала в интернет-компаниях или интернет-департаментах традиционных компаний. С 1999 года, в течение одного года, Анна работала в интернет-газете Deadline.ru, в должности аналитика; с 2000 по 2001 гг. выполняла обязанности PR-менеджера и редактора информационного портала интернет-агентства Webrating.ru; с 2001 по 2002 гг. работала редактором сайта Outdoor.ru компании News Outdoor Russia; в течение следующего года была директором по развитию агентства «Медиалэнд» холдинга «РБК». С 2003 года по настоящее время Анна Артамонова работает в компании Mail.ru, где занимает должность вице-президента и директора по маркетингу и PR.