У Алисы от «Яндекса» голос Скарлетт Йоханссон и глаза в вашем смартфоне
Умная камера, поиск паспорта и СНИЛС на Яндекс.Диске, автоматический перевод на Ютубе — это лишь часть навыков, которыми владеет голосовой помощник Алиса. Как будет дальше развиваться Алиса, за что ее любят дети, и о многом другом рассказал гендиректор Яндекс.Технологий Андрей Стыскин.
Алиса — это голосовой помощник от «Яндекса», по сути, это интернет-ассистент, который помогает сформулировать проблему, уточнить вопрос, чтобы в сложной ситуации человек с ее помощью смог разрешить свою жизненную ситуацию. Алисе не нужно напоминать контекст, она заминает, к примеру, какие фильмы вы любите, и делает подборку кино, которая подходит именно вам.
— Алиса для всех разная, для кого-то друг, для кого-то помощник, для кого-то ассистент, для меня она скорее помощник, пока не друг, но кто знает, — отметил Стыскин. — Алиса основана на трех компонентах: ей доступны знания всего мира, так в ее основе лежит поиск и переводчик. Второй компонент — это словно «органы чувств», она умеет слышать, говорить, видеть. В приложении «Яндекс» на смартфоне есть функция «Умная камера»: навел на предмет и узнал, что это и цену предмета. И третий кубик — это непосредственно память и понимание сути того, о чем ее спрашивают. Это мозг Алисы — самый критически важный компонент, чтобы она была не просто инструментом, а действительно помогала решать задачи. Основной пример того, как это мозг работает, — это болталка, с которой можно поговорить, она помнит и способна держать контекст на 3-4 предложения назад.
Также Алиса способна быстро найти ваш СНИЛС или паспорт, если вы до этого эти документы загрузили на Яндекс.Диск. Эта функция весьма полезна, когда нужно срочно найти свои документы, а их бумажной версии нет под рукой.
— Достаточно сфоткать паспорт, а затем условно, когда покупаете билет на самолет, спросить у Алисы, “Где мой паспорт?” и среди этих неназванных файлов она найдет сфотографированный паспорт, потому как она анализирует, умеет искать файлы не только по их названию, но и по их содержанию, — добавил гендиректор Яндекс. Технологий.
Еще одной прорывной разработкой «Яндекса» стал автоматический перевод видео на Ютубе, когда даже голос и интонация оказались похожи на оригинал. При этом видеоопереподчик зачитывает параллельно голосу спикера.
«Яндекс» активно завоевывает и детскую аудиторию. Особенно юным россиянам пришлась по душе Яндекс.Станция.
— Можно сказать «Алиса, расскажи ребенку сказку». И это уложит его в кровать. Есть записанные русские народные сказки с сюжетом и моралью, но детям очень важно уметь мечтать, конструировать свои миры, понимать, что в них происходит, создавать ситуации, и понимать, как в них взаимодействуют разные люди и разные герои. Теперь дети это могут делать вместе с Алисой. Для этого достаточно сказать «Алиса, давай сочиним сказку», и Алиса не просто проводит по готовому сюжету, ребенок сможет вводить новых героев, говорить, что они делают, и Алиса, понимая это, может достраивать сюжеты. Это вау, это не только является неким культурным кодом, но и заставляет детей мечтать, — подчеркнул спикер.

При этом многие пользователи отмечают приятный тембр голоса Алисы. Голосового помощника озвучила известная актриса дубляжа Татьяна Шитова. Именно она озвучила большинство героинь Скарлетт Йоханссон. Также в игре «Ведьмак» Шитова озвучила чародейку Йеннифэр, а в одноимённом сериале, вышедшем на Netflix, — Тиссаю де Врие.
Алиса умеет чувствовать настроение пользователя. Так, утром она общается с нами бодрым голосом, заряжая энергией на весь рабочий день, а вечером уже куда более спокойным тоном.
Мы в редакции опробовали данные функции и в целом приятно удивлены, хотя некоторые сервисы работают с определенными ошибками. Например, функция «Умная камера» далеко не всегда правильно угадывает предметы в кадре и находит в интернете достаточно условный аналог товара, который можно заказать. Автоматическая озвучка роликов в YouTube помогает скорее понять общий смысл, но стопроцентной заменой профессионального перевода и озвучания пока быть не может из-за большого числа неточностей.
Фото: скриншот с сайта Алисы
Telegram Стратегии
26.01.2022
Yandex и Google научатся реагировать на голос
20 сентября 2010 14:21 Вести ФМ
Два крупнейших поисковика Рунета Yandex и Google запускают голосовой поиск. Сервис распознает речь и помогает искать информацию в сети по надиктованным запросам. На Yandex сервис начнет работать в четвертом квартале этого года.
Два крупнейших поисковика Рунета Yandex и Google запускают голосовой поиск. Сервис распознает речь и помогает искать информацию в сети по надиктованным запросам. На Yandex сервис начнет работать в четвертом квартале этого года. Первоначально эта услуга будет доступна только пользователям мобильных yandex-карт.
«Вести ФМ»: Антон, здравствуйте! Помогите разобраться, что именно из себя будет представлять голосовой поиск, и как же он будет работать?
Меркуров: В «Гугле» он уже работает. Вы можете запустить приложение и на английском языке сказать какое-нибудь слово, оно конвертируется в какой-то формат, и вам придет ответ. Другой вопрос, сам «Гугл» утверждает, что для развитых стран, например, США, где-то четверть запросов уже делается голосом, а не текстом, как нам привычно, но пока, как мне кажется, все это больше напоминает то, что мы с вами когда-то видели в фантастических фильмах и читали в книжках.
«Вести ФМ»: Антон, правильно ли я вас понимаю, что такая услуга не имеет перспектив, по крайней мере, в России?
Меркуров: Почему не имеет? Все имеет. Пока это очень интересная, футуристическая технология. Распознавание речи только в последние годы начинает набирать такие обороты, что это можно использовать в промышленных масштабах, например, всем нам дать возможность голосового поиска. Но должно пройти еще какое-то время, чтобы эту услугу освоили, и она стала действительно массовой. Мы просто с вами еще не привыкли делать все голосом, мы до сих пор управляем компьютером руками, а не голосом.
«Вести ФМ»: Антон, если посмотреть на практику, вы сказали, что компания «Гугл» на английском языке уже давно разработала идею и воплотила ее в жизнь. Если посмотреть на то, что представляет из себя интерфейс от «Гугл», как можно пользоваться этой услугой? Детали расскажите. Я захожу на страницу, и дальше мои действия?
Меркуров: Там легко. Во-первых, не на страницу. Проще всего, если у вас телефон на базе операционной системы «Андроид», вы нажимаете на значок «Приложения», там появляется, если я не ошибаюсь, микрофончик, вы говорите свой поисковый запрос, и вам в разных формах — там и в текстовом виде, и в голосовом — выдается результат вашего поискового запроса. Не могу сказать, что это очень удобно, и этим хочется пользоваться каждый день, но с технологической точки зрения – это важно, интересно, и, конечно же, нужно.
«Вести ФМ»: Смотрите, у компании «Гугл», которая запускает этот проект почти одновременно с «Яндексом», речь идет именно о русском языке, технология отработана, в частности, на английском, китайском, японском языках, как вы считаете, компания «Яндекс» каким-то образом будет отличаться от того сервиса, который предлагает «Гугл»? Ведь надо как-то выпендриться и отличиться?
Меркуров: В данный момент «Яндекс» в силу исторических причин сильно лучше адаптирован для русскоязычного рынка. И, насколько я знаю, компания, которая разрабатывала для «Яндекса» голосовой поиск и распознавание речи, я думаю, в силу того, что она российская, будет лучше работать с русским языком и с нашими миллионами акцентов и произношений. Пожалуй, именно российские корни – это главное конкурентное преимущество «Яндекса» на российском рынке.
Полностью комментарий Антона Меркурова относительно голосовых запросов слушайте в аудиофайле
новости
Siri от Apple уделяет особое внимание голосовому поиску. Только на этот раз разговор выходит за рамки болтовни об iPad и iPhone и включает «Siri», голосовое приложение, которое захватывает воображение потребителей.
Персональный помощник Apple с приятным голосом и голосовым управлением, ключевой фактор в создании блокбастера для iPhone 4S, вдохнул новую жизнь в когда-то малоизвестный и часто оклеветанный мир технологии распознавания речи.
Siri, которая может делать все, от диктовки текстовых сообщений и записи встреч в календаре до ответов на общие вопросы, заинтриговала пользователей. Эксперты говорят, что это убедительно продемонстрировало, что распознавание голоса ушло дальше дней, когда команды были расслышаны неправильно, узко определенные ключевые слова и мучительно низкая скорость.
Индустрия смартфонов сейчас изо всех сил старается соответствовать и улучшать предложения Apple. Google Inc GOOG.O и Microsoft Corp MSFT.O, вероятно, захотят заработать на взрыве интереса к области, в которую они инвестировали в течение многих лет, не получая ничего подобного тому вниманию, которое привлекает Siri.
«Все производители мобильных телефонов инвестируют в речь, расширяют инвестиции в речь, создают более элегантный дизайн и все более глубоко интегрируют ее в телефоны», — сказал Майкл Томпсон, старший вице-президент по мобильным устройствам компании Nuance NUAN.O, специализирующейся на распознавании голоса.
Томпсон сдержанно рассказал о планах своей компании на будущее, но сказал, что ожидает, что голос станет центральной темой выставки Consumer Electronics Show в Лас-Вегасе, поскольку производители устройств борются за внимание инвесторов, СМИ и потребителей.
Ожидается, что голосовая связь будет использоваться во многих сферах бытовой электроники, но эта технология особенно актуальна для мобильных телефонов, поскольку упрощает работу с веб-страницами и набором текста.
Интернет-продавцы, такие как eBay EBAY.O, также присоединяются к этой тенденции. И появились сообщения о голосовом управлении для TVS от южнокорейской LG Electronics 066570.KS незадолго до выставки CES, которая откроет свои двери в Лас-Вегасе на этой неделе.
Многие компании на CES еще не готовы демонстрировать продукты, которые могут сравниться с Siri или превзойти ее, сказал аналитик Forrester Research Чарльз Голвин. Но он сказал, что ожидает, что нынешний всплеск активности приведет к значительному усовершенствованию голосовых продуктов в ближайшие годы по мере совершенствования технологии.
Конкуренты Apple планируют поставлять телефоны с улучшенной голосовой технологией осенью, как раз к сезону отпусков в конце 2012 года, сказал Томпсон из Nuance, которая поставляет и лицензирует технологии для Apple, но имеет собственное голосовое приложение.
Даже традиционные производители ПК присоединятся к победе: Intel объявила на выставке CES в понедельник, что она примет технологию голосового управления Nuance «Dragon NaturallySpeaking» на ультратонких ноутбуках, получивших название UltraBooks, которые появятся в этом году от таких компаний, как Dell. DELL.O и Hewlett Packard HPQ.N.
«Голос как средство ввода будет становиться все более и более полезным и все более распространенным», — сказал Голвин. «Потребители имеют много негативного исторического опыта. Они будут все больше и больше сталкиваться с хорошими голосовыми интерфейсами».
Люк Питерс демонстрирует Siri, приложение, которое использует распознавание и обнаружение голоса на iPhone 4S, возле магазина Apple в Ковент-Гардене, Лондон, 14 октября 2011 года. REUTERS/Suzanne Plunkett развиваться по мере того, как все больше потребителей привыкают к нему.
Интерес к голосовым функциям уже вызывает приобретения, и Nuance нацелилась на телефоны на базе операционной системы Android от Google. В прошлом месяце он купил Vlingo, разработчика приложений для голосового управления для телефонов на базе Android.
Производители телефонов Android — основные конкуренты Apple — включают Samsung Electronics Co Ltd 005930.KS, HTC Corp 2498.TW и Motorola Mobility MMI.N, которую покупает Google.
Тем временем некоторые разработчики помогают производителям телефонов заполнить пробел. Новое приложение под названием «Спроси Зигги», запущенное несколько недель назад на смартфонах на базе Microsoft Windows, вызывает ажиотаж среди пользователей, поскольку оно позволяет им обновлять Facebook, Twitter, отвечать на тексты и вопросы — и все это посредством речи.
Бесплатное приложение помогает телефону с Windows имитировать функции Siri и уже является одним из самых загружаемых приложений в своей категории.
«Международный мир вызвал большой интерес», — сказал Шай Лейб, разработчик Ask Ziggy, который сообщил агентству Рейтер, что его почтовый ящик завален отзывами пользователей, в том числе и сотрудников Microsoft.
Лейб планирует внедрить в приложение голосовую технологию, чтобы сделать телефоны полностью свободными от рук. Игровая система Microsoft Xbox Kinect на основе жестов также расширила возможности использования жестов рук для управления экранами и выполнения команд — так называемый интерфейс «Особое мнение», названный в честь научно-фантастического автомобиля Тома Круза.
«С успехом Microsoft Kinect и Siri от Apple новые способы взаимодействия с CE-устройствами внезапно стали приоритетными, — написал на прошлой неделе в своем блоге Бен Арнольд, директор по отраслевому анализу NPD. «Я ожидаю, что несколько компаний будут демонстрировать продукты, используя некоторые из этих новых методов интерфейса, чтобы выделиться».
Лейб утверждает, что ничто не мешает смартфонам также использовать распознавание жестов.
«Следующий уровень — улучшить речь, грамматику и сделать ответы немного более разговорными», — сказал он. «Возможности потрясающие, особенно с Kinect».
«Я с нетерпением жду, что произойдет с Windows 8, и будут ли в будущем обновления для телефона Windows, которые могут распознавать жесты».
ИСТОРИЯ РЕЧИ
Компания Apple не первой внедрила речь в телефоны. У Google есть приложения для распознавания речи для Android-смартфонов уже более двух лет, и теперь, возможно, они пытаются расширить свои возможности за счет недавнего приобретения компании Alfred.
Альфред использует технологию искусственного интеллекта, чтобы просеивать огромное количество данных в Интернете и рекомендовать рестораны, бары и другие реальные места, которые могут понравиться пользователям. Некоторые эксперты говорят, что эта технология может стать важным строительным блоком, который Google может объединить с существующей технологией распознавания голоса, чтобы создать свой собственный ответ Siri.
Компании электронной коммерции также пытаются наверстать упущенное, не желая быть застигнутыми врасплох, если потребителям станет удобнее использовать голос для поиска в Интернете и покупок в Интернете.
EBay планирует ввести функцию голосового и графического поиска для своего онлайн-рынка и мобильное программное обеспечение Red Laser для проверки цен.
Главный исполнительный директор EBay Джон Донахью заявил, что верит, что Siri — это только начало, и видит будущее, в котором пользователи смогут говорить о своих предпочтениях в телефоне, чтобы сузить выбор покупок.
Дэн Миллер из Opus Research, Сан-Франциско, согласен. Его особенно заинтриговали сообщения в ноябре прошлого года о приобретении Amazon.com AMZN.O компании Yap, чье программное обеспечение конвертирует голос в текст.
«Часы тикают. В ближайшие год или полтора ждите говорящего Kindle, поддерживающего коммерцию», — сказал Миллер.
Миллер, изучающий голосовые технологии около 25 лет, сказал, что он доволен внезапным вниманием к голосу, поскольку он вспоминает годы недовольства потребителей автоматизированными системами обслуживания клиентов.
«Мы очень рады видеть такое положительное внимание, — сказал он, — в отличие от «О, машина меня не понимает».
Репортаж Пурнима Гупта и Шинейд Кэрью; Под редакцией Эдвина Чана и Стива Орлофски
Анатомия магазина приложений: лидер российского поиска Яндекс запускает магазин приложений
IoT — Connected Intelligence
org/Person» itemprop=»author»> Стивен Макс Паттерсон, Сетевой мир |
О программе |
Наблюдения и записи Стива Паттерсона основаны на его 20-летнем опыте работы в первобытной жиже стартапов в Бостоне и районе залива Сан-Франциско.
Мнение
Яндекс, очень похожий на Google, очень вовремя выходит на российский рынок мобильных приложений.
Магазины приложений, такие как Google Play, а также магазины Apple и Amazon, появились так быстро, что мало что о них известно, кроме того, что они распространяют бесплатные и платные мобильные приложения. Ведущий российский поисковик Яндекс объявил о своем намерении войти в бизнес магазинов приложений на Open Mobile Summit в Сан-Франциско на этой неделе. Поздний выход, магазин приложений Яндекса для Android, подчеркивает цель и функцию магазина мобильных приложений.
Россия, как и остальные страны БРИК , отстает от Запада в распространении смартфонов, что делает дебют этого магазина приложений своевременным. 12 миллионов Android-смартфонов, которые, по прогнозам, будут проданы в следующем году в России, где проживает 143 миллиона человек, составляют ничтожную долю от общего объема мировых поставок. В ожидании растущего российского рынка смартфонов Яндекс использует свое положение на рынке и активы бренда, чтобы получить долю в бизнесе магазинов мобильных приложений и расширить свою доминирующую долю российского поиска и рекламы на мобильные устройства.
Яндекс очень похож на Google. Он лидирует и зарабатывает большую часть своего годового дохода в 1 миллиард долларов от поиска. Как и у Google, у него есть портфолио электронной почты, личных приложений, карт и облачных сервисов для привлечения потребителей и дополнения поиска. Как и Google, Яндекс выбрал Android в качестве стандарта контента для своей платформы магазина приложений.
Яндекс сотрудничает с рядом производителей смартфонов Android, таких как Pocketbook, Text и Q, для предварительной загрузки почты Яндекса, личных приложений и карт, включая собственное приложение магазина приложений Яндекса. Яндекс сотрудничает с МегаФоном, одним из трех крупнейших российских операторов мобильной связи, в качестве магазина приложений МегаФона и распределения доходов.
Россия сильно отличается от рынка Северной Америки. Российские потребители тратят в среднем 15 долларов США в месяц на услуги мобильной связи и передачи данных с предоплаченных счетов. Яндекс интегрировал свой магазин приложений в биллинговую систему оператора МегаФон, чтобы потребители могли оплачивать приложения из предоплаченных балансов, увеличивая доходы и заменяя поток доходов оператора от дополнительных услуг, таких как рингтоны, которые теряются при переходе потребителей на смартфоны. Биллинг оператора связи имеет решающее значение для успеха, потому что у немногих российских потребителей есть кредитные карты, а платежные системы банковского счета, используемые в западной экономике, недоступны.
Имея 61% российского рынка поиска и 51% рынка мобильного поиска, Яндекс находится в уникальном положении, чтобы понять, какие мобильные приложения ищут потребители, и как привлечь потребителей в магазин приложений Яндекса.
Благодаря таким якорным приложениям, как «Angry Birds» и «Cut the Rope», а также доступу к ассортименту магазина приложений Opera, Яндекс имеет базу продаваемых приложений и стремится расширить свой ассортимент русскоязычных и англоязычных приложений.
Яндекс представляет мобильные возможности на международных рынках, где мотивированный бренд имеет такие ресурсы, как база использования личных приложений, поисковая аналитика и продвижение, а также локализованные платежи для входа и роста в бизнесе мобильных приложений. В этом случае Яндекс получит новый источник дохода от мобильных приложений, а также улучшит возможности мобильного поиска и рекламы.
Связанный:
- Мобильные приложения
- Google Play
Стивен Макс Паттерсон живет в Бостоне и Сан-Франциско, где он следит и пишет о тенденциях в платформах разработки программного обеспечения, мобильных устройствах, Интернете вещей, носимых устройствах и телевидении следующего поколения.