Исследователи из Microsoft Research создали приложение для ввода текста движением глаз

Говорят, взглядом можно сказать очень многое, но что если движение глаз действительно оказывается последним доступным человеку способом коммуникации? В этом случае на помощь приходят технологии. Исследователи из Microsoft Research при участии коллеги из Университета Вашингтона реализовали удобный и недорогой метод ввода текста взглядом, сделав его значительно более доступными для людей с недостатком двигательной способности (к примеру, страдающих боковым амиотропическим склерозом, который диагностирован у Стивена Хокинга).

Специальное оборудование, которое позволяло парализованным пациентам «печатать глазами», существовало и раньше. Обычно оно работает так: сидящий перед камерой пользователь сначала переводит взгляд в сторону одной из нескольких групп букв, а вторым движением глаз выбирает конкретную букву в группе, затем повторяет это с каждой следующей буквой. Для отслеживания направления взгляда в таких системах используются инфракрасные датчики, которые плохо работают при свете, а стоимость всего комплекта может составлять пять-десять тысяч долларов.

Ученым из Microsoft Research удалось не только значительно удешевить систему, но и упростить сам процесс ввода. Созданная ими программа Eye-gaze работает на обычном смартфоне и следит за глазами через его камеру. Из дополнительного оборудования понадобится лишь картинка с буквами, а сам смартфон даже не нужно закреплять на штативе. Отказ от инфракрасных датчиков также означает, что Eye-gaze можно использовать при ярком солнечном свете.

Программа сканирует и захватывает изображение глаз с помощью технологии распознавания изображений Microsoft, после чего соотносит каждое движение глаз с соответствующими командами.

Упрощение процесса печати достигается благодаря предиктивному механизму ввода текста,знакомой любому, кто пользовался телефоном с кнопками. Групп букв в Eye-gaze всего четыре, и пользователю достаточно выбирать лишь группу, но не букву в ней. Для удаления введенной буквы нужно моргнуть левым глазом, а для подтверждения слова — правым. Ассистент, держащий в руках телефон с Eye-gaze, видит список подсказок и может помогать вводить слова, выбирая подходящие по контексту варианты.

Подробно ознакомиться с процессом работы программы можно в демонстрационном видео.



Такой метод заметно ускоряет и упрощает коммуникацию людям с ограниченными двигательными возможностями. В среднем на печать предложения при помощи Eye-gaze уходит примерно полторы минуты, тогда как ввод того же предложения на более дорогой и сложной системе e-tran занимает более двух минут. Опрос участников тестирования показал, что они находят Eye-gaze менее сложным и более приятным способом ввода.

Опубликовал: Александр Абрамов (info@ict-online.ru)

Рубрики: ПО, Инновации

Ключевые слова: Microsoft