Умная колонка в фоновом режиме записывает короткие аудиоотрезки, чтобы вовремя распознать активирующее слово — «Alexa» — по базовым настройкам, или «Echo», а также любое другое, при внесении изменений владельца в систему активации устройства. По обещанию сайта Amazon, аудиозапись не сохраняется, без предварительного активизирования гаджета. Часто случается, что Alexa распознаёт как активирующее другое слово или даже сочетание слов.
К примеру, французское «avec sa» («с ним» или «с ней») или испанское Hecho (переводится как «факт»). В некоторых случаях Alexa самостоятельно включает запись не получив при этом какой-либо команды. Такие аудио дорожки можно распознать по звуку телевизора или неразборчивому шуму в начале записи. По комментариям сотрудника компании, ошибочные записи также необходимо расшифровывать и каждому сотруднику ежедневно попадается около 100 подобных файлов.
Штат корпорации насчитывает тысячи сотрудников по всему миру, в их задачу входит обработка обращений пользователей к помощникам и последующее улучшение его реакции вручную.
Такая работа может занимать по девять часов в день, и за это время каждый сотрудник успевает прослушать около 1 000 записей. Сотрудники, нанятые для такой деятельности, подписывают соглашение о неразглашении (NDA), его условия запрещают разглашать какую-либо информацию о проделываемой работе. Случается и такое, что деятельность ведётся в зданиях, без каких-либо обозначений, указывающих на место положение компании Amazon. Так происходит, например, в Бухаресте.
Расшифрованные аудиофайлы разъясняют и помешают обратно в программное обеспечение устройства. На записях можно услышать совершенно разные вещи: от безобидного пения до детского плача от жестокого обращения родителей. Периодически сотрудники обмениваются особенно «зацепившими» аудио по внутренней системе-чату.
Также, по информации источников, известно, что на некоторых записях, по их мнению, были сцены сексуального насилия. Конечно, для таких случаев у Amazon есть четкая инструкция действий. Но в этой ситуации, после обращения двух румынских сотрудников в компанию, пришёл ответ, что вмешательство не дело Amazon.
Представители Amazon, комментируя ситуацию, подтвердили факт прослушки сотрудниками компании записей пользователей, но подчеркнули, что позаботились об обеспечении безопасности данных клиентов. Также было добавлено, что компания расшифровывает небольшую выборку голосовых записей Alexa, с целью улучшить качество обслуживания. Такая информация помогает в обучении систем распознавания речи, чтобы Alexa могла лучше понимать своих пользователей и могла выполнять свою работу для всех одинаково хорошо.
Amazon никогда не скрывала, что запросы пользователей используются как обучающий материал для голосового помощника, но только сейчас выяснилось, как именно происходит этот процесс. Информирование пользователей происходит через сайт компании, но мало кто обращает на это внимание.
По мнению эксперта Мичиганского университета, занимающегося изучением проблемы конфиденциальности данных владельцев устройств на базе ИИ, станет ли эта ситуация чем-то опасным зависит от того, на сколько хорошо Amazon защищает данные и кому открывает доступ этим материалам.
Вопрос конфиденциальности персональных данных один из самых остро стоящих в США в последние годы. Огромное количество утечек персональных данных, реквизитов, переписок пользователей все чаще происходят на платформах таких интернет-гигантов, как Facebook, Apple, Google. Суды и слушания в Конгрессе по этой проблеме происходят практически без перерыва. Бывший директор ФБР,в марте 2017 года отмечал, что для Америки такое явление как полная конфиденциальность не характерно.