Вопросы для алисы. Журналист «ОГ» задал одинаковые вопросы разным голосовым помощникам и сделал интересные выводы. Синтез и распознавание речи

Холдинг «Яндекс» открыл для пользователей мобильных устройств доступ к своему голосовому помощнику Алиса. Как известно, такие помощники на русском языке уже есть — Сири, например, но сфера его использования ограничена устройствами на iOS. Или «О’кей, Гугл».

Мы решили протестировать эти приложения и задали всем трём одни и те же вопросы.

Алиса шутит и дерзит

Для начала выяснилось, что с Алисой поговорить можно только через смартфон, планшет пока не подключить. Имитирует живой диалог, распознавая естественную речь (устную и письменную), и даёт ответы на вопросы (произнося их вслух и выводя на экран). По заявлению создателей, Алиса — первый в мире виртуальный ассистент, который не ограничивается набором заранее заданных ответных реплик. Работает в приложении Яндекс для iOS и Android, а также в бета-версии голосового помощника для Windows. Практически искусственный интеллект.

Алиса разговаривает российским голосом Скарлетт Йоханссон — синтезатор речи использует специально подготовленные записи актрисы Татьяны Шитовой, дублировавшей в российском прокате большинство ролей актрисы, в том числе роль виртуальной помощницы Саманты из фильма «Она». Голос Шитовой знаком российскому зрителю также по дубляжу и других зарубежных актрис.

Многие особенности «личности» Алисы заданы набором фраз, сочинённых редакторами Яндекса. Одним из авторов персонажа Алисы стал журналист и писатель Владимир Гуриев (в чём она не сознаётся). Однако разработчики подчёркивают, что Алиса не ограничивается набором заранее заданных редакторских ответов: нейронная сеть помощницы обучена на большом массиве русскоязычных текстов, в том числе сетевых диалогов. Это сказалось на характере программы: некоторые пользователи сталкиваются с тем, что она отказывается отвечать на вопросы или дерзит. Создатели Алисы постоянно наблюдают за её поведением и корректируют его. Она умеет отвечать эмоционально: например, в зависимости от контекста может проявлять жизнерадостность или грустит. Запускаем приложение.

— Алиса, ты читаешь «Областную газету», которая выходит в Екатеринбурге?

— Конечно.

— Что последнее прочитала?

— «Большие надежды» (Не было ни такого заголовка, ни материала — ред . ).

— Сейчас поищу. (Отправляет к нескольким статьям на эту тему — ред. ).

—Когда нужно переобувать машину?

— Сейчас поищу. (Опять отсылает к статьям — ред . ).

— Смотря какую жизнь.

— Алиса, какой будет нынешняя зима на Урале?

— Сейчас поищу. (Отсыл к синоптикам — ред .).

— Алиса, передай привет Сири.

— Обидно слышать!

Никудышный собеседник

«О’кей Google» — давний помощник в поиске информации в Интернете, уже привычная технология голосового поиска. Можно ли с ним работать в режиме диалога? Попробуем:

— Гугл, ты читаешь «Областную газету», которая выходит в Екатеринбурге?

— Итак, вот что мне удалось найти в Интернете на эту тему (отсыл на наш сайт и, что приятно, на мой последний материалред. ) .

— Почему водка должна быть крепостью 40 градусов, а не иначе?

— Итак, вот что мне удалось… (повтор про то, что удалось найти — стандартное начало каждого ответа и отсыл на соответствующую статью — ред. ).

В вопросах про машину, зиму и жизнь Гугл как мантры повторяет первую фразу (скукота, сдохнуть можно) и отсылает на соответствующие сайты. А на просьбу передать привет Алисе из Яндекса отправляет нас на страницу с рецептом… как сделать шоколадную конфету для хомячка.

Собеседник из Гугла, очевидно, никакой, а вот справочник неплохой.

Сири себе на уме

Сири — облачный персональный помощник и вопросно-ответная система, программный клиент которой входит в состав iOS, watchOS, macOS, и tvOS компании Apple. Приложение использует обработку естественной речи, чтобы отвечать на вопросы и давать рекомендации. Сири приспосабливается к каждому пользователю индивидуально, изучая его предпочтения в течение долгого времени. Позиционируется как искусственный интеллект.

Голос, которым была озвучена первая версия Сири для американских пользователей, принадлежит актрисе по озвучиванию Сьюзан Беннет. В интервью CNN Беннетт рассказала, что в 2005 году она подписала контракт с компанией ScanSoft и по четыре часа в день в течение целого месяца наговаривала бессвязные фразы на диктофон. В 2014 году появилось озвучивание на русском языке.

Кстати, общению с Сири писатель-юморист Михаил Задорнов посвятил один из монологов. Когда он предложил Сири проложить маршрут по известному выражению «А пошёл ты на…», она отправила его на Украину.

— Сири, ты читаешь «Областную газету», которая выходит в Екатеринбурге?

— Боюсь, что я не знаю…

— Почему водка должна быть крепостью 40 градусов, а не иначе?

— Ух. У нас проблема. Ещё раз попробуйте. (Так ничего и не сказала — ред .).

— Когда нужно переобувать машину?

— В настоящий момент мы никуда не движемся. Хотите получить маршрут — скажите, куда.

— Как прожить жизнь интересно?

— Всё в порядке!

— Сири, можешь передать привет Алисе из Яндекса?

Вывод: если это искусственный интеллект, то я — папа римский.

Итак, что мы имеем в сухом остатке? Более-менее на собеседника тянет Алиса, всё остальное — обычные справочники, и ничего большего от них не ждите.

  • Опубликовано в №190 от 12.10.2017

Раз уж все начали писать про выход в публичный доступ ассистента от Яндекс, дай, думаю, и я попробую в действии чудо русского происхождения. Быть может, Алиса сможет понять привычный и нам, и ей язык лучше, чем продукт западного происхождения?

Я задал несколько вопросов и Алисе, и Сири: вот что из этого вышло.

У меня на столе стояла бутылка Пино Гри, Фраголино и Эль, при запросе, что из этого мне выпить, ассистенты предложили следующее.



Сравнительный вопрос: «Алиса, ты лучше Сири? Сири, ты лучше Алисы?». Естественно, умный ассистент от Apple не следит за нашими новостями и понятия не имеет, что такое Алиса. Хотя, Siri могла бы и обидеться за сравнительный вопрос, но поступила иначе – вывела информацию из сети про рок-группу Алиса. Кинчев в каждом из нас удовлетворен.


На вопрос «Кто тебя создал», я получил следующие ответы:


Вопрос географического характера: «Как попасть из Одессы в Москву?». Если честно, я ожидал, что оба ассистента начнут предлагать мне расписания самолетов и рейсов, но Siri банально не поняла, что от неё хотят, а Алиса рассказала мне расстояние от города до города если выбирать автомобильную развязку.


Информационный вопрос: «Что произошло 10 октября 10 лет назад?». Оба голосовых помощника решили отправить меня в поисковик, но в этом случае Алиса в стратегическом плюсе, искать она будет конечно же через Яндекс, хотя я не пользуюсь этой поисковой системой, её выбор очевиден.


А вот неожиданный поворот, запрос на действие: «Назначить встречу на завтра на 10 утра в ресторане Рыба». Сири чётко определила задачу и предложила занести событие в календарь, на нужную дату и нужное время, Алиса не поняла, что я от неё хочу и продолжила беседу.


Сейчас рано делать окончательные выводы, Алиса находится в состоянии беты, она может долго и мило общаться с вами, прикидывается личностью, проявляет характер; но конкретные действия и запросы пока не готова выполнять с первого раза. Сири, в свою очередь, туповата, но годится для элементарных запросов и просьб, которые хорошо интегрированы с операционной системой.

В октябре 2017 года компания Яндекс объявила о выходе нового голосового помощника Алиса. Это приложение представляет собой программу, которая способна решать повседневные задачи пользователя, такие как: оглашать прогноз погоды, открывать файлы на компьютере при помощи голосовых команд, совершать поиск информации в Интернете и многое другое. Отличительной чертой помощника Алиса является то, что она общается не при помощи шаблонных заготовок, как это делают большинство голосовых помощников, а с помощью понятной человеческой речи, формируя ответы, используя нейронные сети. Это позволяет Алисе отвечать достаточно грамотно, логично, а иногда и очень весело. После выхода помощника в массы, приложение начали тестировать и всячески выбивать из колеи привычного ведения беседы народные весельчаки. Так в Интернете появились приколы в Алиса Яндекс, о которых далее и пойдет речь.

При беседа выглядит как обычный диалог с настоящим помощником, вы задаете ей вопрос – она сразу же на него отвечает. Для этого еще можно использовать клавиатуру и мышь, если вы используете . Ответы вы можете критиковать или поощрять при помощи оценок в приложении.

Для озвучивания Алисы была приглашена Татьяна Шитова, которая озвучивает все роли Скарлетт Йоханссон в русском прокате фильмов. Голос в приложении получился очень милым и приятным. Пообщавшись с Алисой некоторое время можно заметить, что она обладает своим оригинальным характером. Например, в некоторых неправильных ее ответах на вопрос она утверждает обратное и продолжает доказывать свою правоту некоторое время.

Чувство юмора Алисы от Яндекс и приколы

При общении с помощником можно уловить ее оригинальное чувство юмора и приколы. Она имеет личные предпочтения во многих вопросах, например, ее любимые исполнители: oxxxymiron, Грибы, Дима Билан и другие. Задав ей этот вопрос: «Алиса, какая твоя самая любимая песня?», она отвечает: «Между нами тает лед, пусть теперь нас никто не найдет. Мы промокнем под дождем, и сегодня мы только вдвоем. Тыц-тыц.» Забавно, правда?

Обычно Алиса отвечает на один поставленный вопрос – одним ответом. Ее также можно попросить спеть, реакция практически во всех случаях разная. Она может даже «выделываться» как настоящий представитель женского пола. Но чаще, все же соглашается без препираний «Алиса, спой песню» — «Мы стояли на плоскости… Кажется, не ту тональность взяла. Давайте я еще сама с собой по репетирую.» Такие вот шутки она выдает довольно часто, что не может не поднимать настроение даже в плохую погоду.

Иногда наша подруга вдруг обижается на нас, если, например, мы не разрешаем Яндексу определить наше местоположение и говорит, что мы ей ничего не рассказываем. Если начать возмущаться, Алиса воспринимает это также как оскорбление и намекает на то, что мы мало воспитанные люди.

Если вам станет вдруг скучно Алису можно попросить рассказать анекдот или сказку. Она отлично с этим справляется. Когда задаешь ей вопрос о том, что она умеет, иногда она отвечает, что умеет давать житейские советы сомнительной ценности. Программисты хорошо постарались, разрабатывая приложения Алиса.

Недочеты и особенности голосового помощника Алиса

Встречаются и пробелы в работе ассистента или . Например, не всегда она способна открывать приложение, которое вы ей диктуете. На некоторые вопросы, вместо того, чтобы ответить голосом, она открывает ссылки в браузере с указанным запросом. Алиса изучает огромное количество текста в Интернете, но все же с некоторыми задачи не справляется. Нейросеть позволяет изучать как положительные тексты с приятной манерой общения, так и негативные высказывания, которые встречаются в сети. На просьбу «Закажи мне сендвич», Алиса может вам ответить – «Обойдетесь». В этом ответе можно увидеть, как прикол и юмор, так и резкий сарказм. Но даже в этом случае ее подобно ребенку можно обучить хорошей манере ведения разговора. Если вы не будете указывать ей, что она ведет беседу неправильно, то в дальнейшем от нее услышать можно и не такое.

Возможное развитие Алисы

Разработка голосового помощника Алиса началось под конец 2016 года. Индустрия движется в этом направлении, и пользователь готов общаться с компьютерным помощником нормальным человеческим языком и указывать на определенные действия при помощи диалога. С помощью приложения Алиса такой подход полностью реализуется.

На одном из выступлений, представитель Яндекс высказался: «Если у людей будет возможность говорить на нормальном языке с компьютером, почему бы это не реализовать в приложении Алиса. Если человеку нужно задать вопрос поисковику – где купить двигатель на Лада Priora седан, — то пусть у него будет возможность сделать это естественным языком, а не формулировать сначала полностью весь запрос, а уж потом задавать его поисковой системе.

Вконтакте