Главная » Статьи » Скажи мне, Саманта

Скажи мне, Саманта

Яндекс представил голосовую помощницу Алису в октябре прошлого года, и с тех пор мы писали про нее очень много: следили за ее развитием, выпускали интервью с разработчиками и даже делали вирусные ролики. Теперь, в честь недавнего выхода Яндекс.Станции, мы решили сравнить возможности Алисы и Саманты — операционной системы из фильма Спайка Джонза «Она», чтобы выяснить, чего еще не хватает голосовой помощнице Яндекса, чтобы стать эталоном искусственного интеллекта будущего.

Алису, голосовую помощницу от Яндекса, с другими аналогами на рынке не сравнивал только ленивый: все обсуждали, в чем Алиса лучше или хуже Сири или Алексы. Сначала возможности Алисы были сильно ограничены (даже разработчики уточняли, что ее еще нельзя называть полноценным голосовым помощником), но вскоре их стали расширять: недавно, к примеру, Алиса научилась обращаться с Яндекс.Музыкой и выключать компьютер. К делу также привлекли сторонних разработчиков: компания представила платформу Яндекс.Диалоги, с помощью которой каждый желающий может обучить Алису делать что-то новое (в самой компании это называют «навыками»).

Голосовым помощникам также не избежать сравнения с «коллегами» из популярных научно-фантастических произведений, например с HAL 9000 из «2001: Космическая Одиссея» или дворецким Джарвисом из экранизации комиксов вселенной Marvel. В случае с Алисой объект для сравнения напрашивается сам собой: голосовая помощница Яндекса говорит голосом российской актрисы Татьяны Шитовой, которая озвучивала искусственный интеллект Саманту в фильме «Она».

Одним голосом, однако, сходство не ограничивается. Как и любой другой голосовой помощник, Алиса умеет искать нужную информацию (и формулировать ее в виде краткого ответа), заказывать такси и пиццу, а даже (если немного покорпеть над задачей) — варить кофе. Разумеется, в отличие от Саманты, которая при первом же знакомстве с главным героем с энтузиазмом взялась за сортировку его писем и задач, доступа ко всем файлам и аккаунтам пользователя Алиса пока не имеет. Но недавно Яндекс расширил функции помощницы, подключив ее к браузеру и наделив ее возможность выключать компьютер, включать-выключать музыку и открывать файлы (редактировать которые пользователю пока что придется самостоятельно). 

Помимо браузерной версии, Алиса также работает и в приложении Яндекса для смартфонов, а совсем недавно воплотилась в виде Яндекс.Станции. Это тоже сближает ее с Самантой, которая умеет «жить» в нескольких гаджетах, а также пользоваться их камерами как глазами, познавая окружающий мир и своего пользователя. 

Говоря о сходстве с научно-фантастическим искусственным интеллектом, нельзя не упомянуть и главное из того, что есть у Алисы — ее «болталка»: голосовая помощница Яндекса умеет разговаривать с пользователем на отвлеченные темы. Именно этим славится и операционная система из фильма Спайка Джонза: Саманта (как и другие индивидуальные пользовательские версии искусственного интеллекта) становится для главного героя сначала приятным собеседником и помощником, затем — приятельницей, а после — романтическим партнером. Столь стремительное развитие отношений человека и машины (которая, кстати, не имеет тела как такового и функционирует только на гаджетах) невозможно без настоящего, человеческого общения об общих интересах и ежедневных проблемах, без шуток и советов, а также без помощи. Это умеет и Алиса: общаясь с пользователем, она — при необходимости — переходит в режим диалога.

Способность «болтать» выделяет Алису на фоне других голосовых помощников и сильно приближает ее к Саманте: тем не менее, стоит учитывать, что запас тем, в которых Алиса ориентируется свободно, довольно ограничен. Зачастую диалог с ней состоит из коротких реплик, которые порой звучат невпопад (но при этом все равно забавно). Саманта же — сущность достаточно свободная и говорить может часами о чем угодно. Задача вполне себе выполнимая, просто требующая огромного количества данных: скажем, научить Алису поддерживать беседу на «человеческом» уровне можно лишь на диалогах реальных личностей. Получить доступ к таким данным очень сложно: разработчики, тем не менее, придумывают способы решения этой задачи, ограничиваясь лишь незначительным вмешательством людей.

Стоит также отметить, ОС из «Она» звучит в точности как человек: в недалеком будущем из фильма, судя по всему, достигли невероятных успехов в синтезе живой речи. Алиса тоже может похвастать довольно естественным звучанием — за ним стоят несколько часов работы актрисы в студии и последующая обработка записи ее речи, которую разбили на минимальные единицы языка с помощью метода Unit Selection. Тем не менее, распознать в ее голосе «искусственные» интонации все же можно. В дальнейшем результат можно улучшить с помощью, скажем, системы синтеза речи Tacotron 2, которую в конце прошлого года представили разработчики Google: в их модели отличить компьютерное звучание от живого голоса практически невозможно.

Алиса, пусть разработчики и пытаются (отчасти успешно) наделить ее самостоятельной личностью, все же не выходит за рамки функций и образа голосового помощника. Саманта изначально задумывалась как самостоятельная личность и обладает задатками самосознания: даже имя себе она придумывает самостоятельно, на основании того, что ей больше нравится. Саманта в фильме к тому же была не единственной искусственной «личностью» — каждый пользователь, купивший себе такую систему, мог получить помощника, друга и любовника — уникального, которого больше ни у кого нет. Все эти личности, пусть и наделенные разными характерами, составляли одну сверхсистему, внутри которой могли общаться между собой. До такой сложной иерархии Алисе (да и другим голосовым помощникам) пока далеко: разработчики искусственного интеллекта в реальном мире таких высот еще не достигли, а, возможно, и не станут даже пытаться — уж слишком поучительные уроки на этот счет дает массовая культура.