«Современные мобильные устройства предлагают нам разные способы взаимодействия с ними. При этом речь остаётся самым естественным из них, и говорим мы обычно гораздо быстрее, чем вводим символы на клавиатуре. Чтобы голосовой поиск работал корректно, для каждого языка мы собираем голосовые фрагменты, из которых потом создаём специальные модели речи. Для этого мы просим носителей языка произнести часто употребляемые фразы в самых разных акустических условиях, например, в ресторане, на улице, в машине. Для каждого языка мы также создаём словарь, содержащий более миллиона распознаваемых слов», – рассказал директор подразделения мобильных продуктов Google Хьюго Барра. «Произнести фразу гораздо проще, чем набирать ее на клавиатуре, особенно на ходу. Теперь узнать погоду, проверить, кто был автором известного афоризма, или найти поблизости ресторан не составит никакого труда, где бы вы ни находились», – обещает Амир Мане, представитель отдела речевых технологий компании Google.
Директор подразделения мобильных продуктов Google Хьюго Барра
Обрисовывая нынешнюю ситуацию на мобильном рынке в России, менеджер по YouTube Mobile Андрей Дороничев заявил, что, на его взгляд, современный рынок созрел для внедрения мощных мобильных решений. К этому привело несколько факторов, важнейший из которых – большое проникновение мобильной связи в России (треть устройств при этом – смартфоны). Кроме того, во многом благодаря платформе Android, операционной системе для мобильных телефонов и смартбуков, основанной на ядре Linux, компании-производители стали выпускать доступные устройства с многофункциональным браузером. Ещё одним немаловажным фактором стало появление доступных тарифов на мобильный Интернет. «Уже сейчас, по данным аналитиков, примерно 13 млн россиян пользуются мобильным Интернетом хотя бы раз в месяц, при этом, скажем, YouTube, ранее бывший практически недоступным на мобильных устройствах, за двенадцать месяцев по популярности среди пользователей сотовых телефонов вырос в три раза», – сообщил г-н Дороничев. Также менеджер продукта отметил, что пользователю функции голосового поиска не потребуются специальные знания – ни о том, что такое поиск, ни даже о том, что такое Интернет и как он работает. Система действует интуитивно понятно и просто – кроме того, как пояснил г-н Дороничев, она способна распознавать идиомы (например, «баксы» вместо «доллары»).
Напомним, что сама функция поиска по поисковым запросам появилась у Google ещё в 2008 году. А разработка данного направления началась в компании в 2005 году. Естественно, сначала Google Voice Search работал только с английским языком – американским, британским, австралийским, индийским и новозеландским. Со временем голосовой поиск стал понимать китайский, японский, корейский, французский, итальянский, испанский, польский и чешский языки. В течение последнего года компания работала над тем, чтобы научить поисковик понимать русский язык. Как сообщают представители Google, всего за год существования функции голосового поиска привычки пользователей существенно изменились. Каждый четвертый поисковый запрос на мобильных устройствах с ОС Android в США производится при помощи голоса.
Команда Google: менеджер по мобильным продуктам Google Андрей Дороничев,
разработчик ПО и один из авторов технологии распознавания речи
на русском языке Евгений Вейнштейн, а также директор подразделения
мобильных продуктов Google Хьюго Барра
Один из авторов технологии распознавания речи на русском языке Евгений Вейнштейн рассказал, что работа над распознаванием языка велась в компании в соответствии с тремя моделями – языковой и акустическими моделями, а также моделью произношения. Для сбора базы данных Google собирает для каждого языка сотни тысяч речевых запросов, основанных на веб-сайтах, кроме того, используется помощь тысяч людей, отличающихся акцентами, возрастом и индивидуальными особенностями. Сбор данных производится в различных шумовых обстановках. «Мы строим языковую модель на базе миллиардов веб-поисков – это даёт возможность распознавать около миллиона слов. При этом система обучается с каждым новым запросом», – сообщил г-н Вейнштейн.
Другие поисковые системы также стараются не отставать. Например, функция голосовых запросов есть у поисковиков Yahoo и Bing, правда, пока только на английском языке. А «Яндекс» начал разработку голосового интерфейса на русском языке ещё в конце 2009 года, а в апреле 2010 года была запущена бета-версия (подробнее – см. новость раздела «Веб» от 20 сентября 2010 года http://spbit.ru/news/n73914/). Сейчас готовится к запуску новая бета-версия сервиса, которая первоначально будет доступна только пользователям мобильных «Яндекс.Карт». С его помощью можно будет искать адреса в Москве и объекты: заправки, банкоматы, парикмахерские и пр., местоположение пользователя при этом будет определяться автоматически. Как заявил руководитель группы мультимедийных поисковых сервисов «Яндекса» Дмитрий Беляев, по своей сути голосовой ввод запросов – это новый интерфейс к уже имеющимся поисковым сервисам: веб-поиску, мобильным картам, поиску товаров и т. д. «Его основное достоинство – упрощение и ускорение ввода запросов в ситуациях, когда людям неудобно делать это традиционным способом, с помощью клавиатуры. Например, во время управления автомобилем. На мой взгляд, голосовой интерфейс будет широко востребован. В первую очередь потому, что все больше и больше пользователей начинают активно пользоваться мобильными приложениями, использующими выход в Интернет. И делают они это преимущественно вне дома. Между тем такие условия использования технологии создают определенные сложности при ее внедрении. Например, нужно научиться выделять человеческую речь из посторонних шумов», – прокомментировал г-н Беляев.
По мнению аналитиков из УК «Финам Менеджмент», в настоящее время голосовые технологии используются повсеместно. К примеру, некоторые модели мобильных телефонов позволяют совершать звонки по голосовой команде – нужно произнести имя абонента. Технология голосового поиска построена теоретически на таком же принципе – речь трансформируется в текст и далее обрабатывается по привычной технологии. Другими словами, как сообщают аналитики, рынок голосовых технологий есть уже давно – первые продукты можно датировать началом 90-х годов, но широкое распространение он начинает получать только сейчас. «Голосовой поиск – важная услуга в тех странах, где развитие и проникновение мобильной связи опережает стационарный Интернет. Потенциально это очень большой рынок. При этом следует понимать, что в современном конкурентном рынке всегда есть инициатор и последователи – поэтому в ближайшее время множество подобных решений выпустят и остальные поисковые компании. Конечно, для Google это будет качественный шаг, так как они первые, и помимо прочего платформа Android становится все более популярной», – рассказала аналитик УК «Финам Менеджмент» Анна Зайцева.
Подробности
Основанная в 1998 году аспирантами Стэнфордского университета Лари Пейджем и Сергеем Брином, компания Google сегодня является одной из лидирующих веб-корпораций на основных мировых рынках. Штаб-квартира Google находится в Силиконовой долине, представительства компании расположены в Северной Америке, Европе и Азии.