Алиса не работает на телефоне
Алиса разработана компанией Яндекс и является своеобразной альтернативой голосовому поиску от Гугл. Она может ответить на разные вопросы, развлечь, когда пользователю становится скучно. Благодаря ей можно найти ответы в Яндекс поиске.
Алиса использует данные о местонахождении мобильного телефона, а потому предоставляет точную информацию о маршруте, ближайших остановках общественного транспорта и его расписании. Благодаря такому поиску возможно узнать даже месторасположение супермаркетов и текущие акции в них.
Однако, часто случается так, что на телефоне не работает Алиса. Пояснений этому явлению достаточно много. В этой статье приведены самые часто возникающие проблемы и пути их решения, если робот вдруг перестал отвечать на команды.
Приведенная ниже инструкция актуально как для мобильной, так и для ПК версии.
Содержание
- Почему не работает
- Появилась ошибка «Нет доступа к интернету»
- Для ПК
- Для Смартфонов
- Что делать если Алиса зависает
- Для ПК
- Для iOs и Android
- Не запускается после перезагрузки
- Появилось сообщение «Требуется обновление безопасности»
- Неправильно распознаются слова
- Заключение
- Видео
Почему не работает
Прежде чем детально разобрать каждую из причин, по которой не работает голосовой помощник Алиса, нужно учесть, что поисковый робот был выпущен только в октябре 2017 года. До этой даты, на персональных компьютерах была доступна лишь бета-версия. Принимая во внимание этот факт, становится ясно, что разработчики стараются улучшать интерфейс, но могут не замечать некоторые ошибки сразу.
Появилась ошибка «Нет доступа к интернету»
Для ПК
Если на экране появилось уведомление о том, что «нет доступа к интернету», то дело, скорее всего, в самой связи. Проверьте подключение, снимите все блокировки, установленные программой антивирусом.
Выявить источник блокировки просто – отключить брандмауэр. Если понятно, что блокирует функцию установленный на ПК антивирус, то в самой программе настраивают опцию проверки соединения HTTPS.
Если же источником блокировки выступает брандмауэр, то в первую очередь нужно открыть доступ соединению для стандартного браузера Виндовс. Для этого перейти в меню «Панель управления», выбрать «Система и безопасность» и нажать на вкладку, отвечающую за настройки брандмауэра.
Чтобы их изменить, необходимо выбрать «Параметры» и в графе «Разрешить другую программу» выбрать проводник.
Для Смартфонов
Необходимо проверить есть ли подключение по Wi-Fi, 3G или LTE. Без доступа к беспроводной связи сервис работать не сможет, так как для функции распознания голоса, нужен двухсторонний доступ к специальному серверу.
Что делать если Алиса зависает
Для ПК
Программа может зависнуть без видимой на то причины. Чтобы убрать эту проблему, необходимо произвести перезапуск. Для этого в панели задач Windows нужно выбрать «Панели» и убрать пометку напротив помощника, а после снова поставить.
Если же программа зависла на смартфоне, то проблема может скрываться в нехватке оперативной памяти. Это случается, когда одновременно в фоне работает слишком много ненужных приложений и телефон не выдерживает нагрузки. Решить проблему поможет удаление из работы запущенных приложений. Примечательно, но на персональном компьютере это неактуально.
Для iOs и Android
Идеально – перезагрузить аппарат, если же это не доступно, выгрузить из памяти браузер и саму утилиту. Чаще всего это спасает ситуацию и при повторном обращении бот работает как часы.
Не запускается после перезагрузки
Нарушение работоспособности наблюдается, когда по каким-то причинам робот был удален из списка программ для автозапуска системы.
Чтобы возобновить работу приложения, нужно запустить Алису заново. Для этого выбрать в панели управления кнопку «Пуск», а в появившейся поисковой строке ввести «Голосовой помощник».
Ассистент занимает много памяти
Проблема может возникнуть, если помощник занимает слишком много памяти в компьютере или телефоне. Что убрать неполадки, необходимо пойти на хитрость и убрать некоторые настройки. Для этого нужно перейти в меню «Настройки Алисы» и снять соответствующие метки напротив голосовой активации, голосовых ответов и истории диалога.
После этого робот будет активироваться только после нажатия на кнопку с изображением микрофона. Алиса не будет отвечать на вопросы голосом, а будет писать ответы в диалоговое окно.
Несомненно, это может быть неудобно, но уж лучше корректная работа помощника, чем полное его отсутствие. К слову, иногда он активизируется из-за близких по звучанию произносимых кодовых слов. Поэтому отсутствие голосового поиска только решит эту проблему.
Если же хочется, чтобы помощник отвечал на вопросы, но этого не происходит, и он не слышит пользователя, то в первую очередь проверяют настройки микрофона. Системе нужно слышать человеческий голос.
Появилось сообщение «Требуется обновление безопасности»
Такая ошибка актуальна для системы Виндовс 7, на которую устанавливается поисковый робот. Постоянно вылетающая ошибка об установке обновления безопасности – это баг стандартного браузера.
Убрать оповещение можно, установив на компьютер последнюю версию Internet Explorer.
Неправильно распознаются слова
Как и любой другой робот, мобильный помощник от Яндекса может путать обозначения из-за неправильно услышанных слов. Если он вдруг перестал вас слышать правильно, то фразу нужно повторить более четко и громко. Если и это не помогло в решении проблемы, то нужно нажать на кнопку «антилайк» и выбрать «Моя речь не распознана». В этом случае, смартфон автоматически отправит сообщение о проблеме разработчикам.
К слову, если «антилайк» был нажат по ошибке, то можно выбрать меню «Да нет, все хорошо» и тогда сообщение не будет послано.
Заключение
Данные статистики гласят, что в мире используется более трех миллиардов голосовых помощников, направленных на улучшение качества жизни человека. Специалисты уверены, что уже спустя пять лет количество ботов увеличиться в пять раз, они станут основой комфортной жизни человека.
В русскоязычных странах Алиса только набирает обороты по популярности, но несмотря на свои ошибки, она полюбилась многим пользователям. С точки зрения функциональности робот сопоставим со знаменитой Сири от компании Apple.
Видео
com/embed/S_t4oolQWlg?feature=oembed» frameborder=»0″ allow=»accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture» allowfullscreen=»»/>Рейтинг
( 1 оценка, среднее 1 из 5 )
На андроиде не работает яндекс поиск. Голосовой поиск Яндекс для компьютера и смартфона – автоматизируем рутинные задачи
К ак вы, возможно, заметили, разработчики Гугл решили не встраивать в собственный браузер Chrome функцию голосового поиска. А вот инженеры Яндекс решили пойти от обратного, и заготовили модуль с аналогичной функциональностью для своих приверженцев, выложив в открытый доступ плагин «Яндекс.Строка». Данное дополнение не требует сторонней инсталляции Яндекс.Браузера. Более того, распространяется он на абсолютно свободной основе, что не может не радовать конечного пользователя. В сегодняшнем материале мы расскажем, как активировать голосовой поиск Яндекс для компьютера и смартфона , как им пользоваться, и на какие возможности тот способен.
Итак, установим модуль «Яндекс.Строка» на ПК. Для этого скачаем дистрибутив расширения с официальной страницы проекта . Сам процесс инсталляции ничуть не отличается от аналогичной процедуры, выполняемой с любыми другими программными продуктами, и на нем мы подробно останавливаться не будем. Просто следуйте инструкциям мастера и спустя буквально минуту приложение окажется установленным на ваш жесткий диск.
Когда все будет готово, на панели задач появится текстовая строка для ввода символьных и голосовых команд.
Как мы уже писали до этого, «Яндекс.Строка» — полностью автономный проект, и для его работы не требуется установка браузера от того же разработчика.
Как использовать текстовый поиск Яндекс для компьютера?
Работать с модулем проще простого: щелкаем мышкой на текстовой строке поиска, и на экране появляется список последних веб-ресурсов, на которые вы заходили, а также тех поисковых запросов, которые в данный момент находятся в тренде.
Итак, с этим разобрались. Теперь следуем дальше: достаточно лишь начать набирать в поисковой строке соответствующее слово или фразу, и приложение тут же предложит вам наиболее популярные поисковые запросы, основанные на вашем ключе.
Причем, если вы введете собственный запрос до конца, либо выберете один из предложенных ключей из списка, тут же запустится ваш используемый по умолчанию браузер, в поисковой строке которого будет доступен заданный вами ключ.
Кроме того, что движок ищет наиболее подходящие поисковые запросы в Интернете, он еще и сканирует содержимое накопителя, в результате чего в результатах появляются названия программ, соответствующие искомому запросу. Как видите, модуль «Яндекс.Строка» весьма всеяден и обладает массой возможностей.
Как работает голосовой поиск Яндекс для компьютера?
Чтобы запустить функцию голосового поиска, необходимо кликнуть мышкой на пиктограмму микрофона и произнести искомое слово или фразу для поиска. Вместо того, чтобы каждый раз использовать манипулятор для запуска фичи, достаточно произнести фразу «Слушай, Яндекс!» в микрофон, после чего модуль также запустится в автоматическом режиме. Если вы сидите перед ноутбуком, это вообще невероятно удобно: поскольку наиболее часто лэптопы оснащаются встроенным микрофоном, для этого даже не нужно подключать гарнитуру.
Если вы все же решили задействовать голосовой поиск Яндекс для компьютера, вам определенно стоит знать, какие команды можно и стоит произносить для обработки движком. Запросы могут быть совершенно любыми, начиная от слов «открой», «найди», «слушать», «перезагрузить компьютер» (или «выключить») и касаться не только операций, производимых браузером, но и содержать в себе слова, относящиеся к работе ПК в целом, а именно: запуску или закрытию определенного приложения, прекращению работы самого компьютера. К примеру, произнеся команду «Открой Word», вы буквально за секунду сможете открыть текстовый редактор, не прибегая к использованию мыши или клавиатуры, а команда «перезагрузить компьютер» приведет к соответствующему производному действию.
Голосовой поиск Яндекс для Андроид
В ОС Андроид функция голосового поиска не является обособленной от , и чтобы пользоваться этой фичей, придется предварительно установить фирменный веб-навигатор от российской компании. Когда это будет сделано, в Андроиде появятся две иконки для запуска голосового поиска. Первая из них – это сам Яндекс.Браузер. Запускаем его, и в центре видим пиктограммку в виде микрофона. Нажимаем ее, и произносим искомую фразу для поиска. Аналогично можем воспользоваться командой «Слушай, Яндекс!».
Второй вариант – специальный модуль, предназначенный исключительно для голосового поиска. Называется он «Слушай, Яндекс!», и работает полностью идентично встроенной в навигатор от Яндекса фиче. Разделить эти две функциональных возможности – на наш взгляд, не такая уж плохая идея, это позволяет выделить данную фишку наравне с прочими модулями веб-браузера, и еще больше привлекает внимание пользователя.
Как настроить голосовой поиск Яндекс для компьютера?
Авторы плагина припасли для нас некоторые настройки модуля, о которых мы сейчас и расскажем. Вызывается контекстное меню параметров путем правого клика на строке Яндекс-поиска. Итак, посмотрим, что же здесь можно понастраивать?
Первое поле «Поисковая строка» отвечает за горячую комбинацию клавиш для быстрого вызова строки поиска. По умолчанию, здесь задана последовательность «Ctrl+Ё», но вы можете изменить ее в соответствии с персональными предпочтениями.
Следующая группа параметров подразумевает кастомизацию работы с файлами на жестком диске. Если файл будет найден, откроется содержащий его каталог, либо откроется сам объект, обнаруженный посредством функции поиска.
Еще один раздел предполагает открытие результатов веб-поиска в окне браузера, установленного в ОС по умолчанию, либо непосредственно в окне Яндекс.Строки. По умолчанию выставлен первый вариант.
Вот и все важные настройки, которые можно установить для работы с функцией поиска в Яндекс.Строке. Ряд дополнительных параметров доступен по нажатию правой кнопки мыши на поисковой строке, но они не настолько важны, поэтому на них мы останавливаться не будем.
Как удалить голосовой поиск Яндекс?
Чтобы удалить модуль из Виндовс, достаточно зайти в менеджер приложений, и удалить Яндекс.Строку как любое другое приложение системы. Для этого стоит открыть панель управления, и выбрать в ней пункт «Удаление программы» в категории «Программы», после чего найти в списке установленных приложений нужный нам плагин под названием «Яндекс.Строка» и выполнить на нем двойной щелчок. Далее просто следуйте инструкциям мастера, и вскоре программа будет удалена.
Итоги
Вот мы и разобрались, на что способен голосовой поиск Яндекс для компьютера, а также для смартфона. Данная фича является невероятно удобной и востребованной. Разобравшись с ней один раз, вы сможете пользоваться своим любимым поисковым движком (Гугл, Яндекс, Bing или любым другим) гораздо быстрее и продуктивнее, а это, в свою очередь, сэкономит вам немало времени и усилий.
Яндекс на андроид — это приложение одноименной поисковой системы, которое позволит держать все, что необходимо для сёрфинга в интернете не только под рукой, но и под пальцем, который управляет используемым гаджетом.
Здесь есть все, что необходимо пользователю с самого утра. Это постоянно обновляющиеся главные новости, в которых можно узнать о последних событиях в мире, в вашем городе или в любой области знаний, настроенной в фильтре. Создавайте сами для себя новостную ленту с помощью приложения «Яндекс».
Почему стоит скачать Яндекс на андроид?
Также есть возможность следить за курсом валют на валютном рынке. Данные также постоянно обновляются, поэтому вы всегда останетесь в курсе самых свежих новостей.
Телепрограмма Яндекс на андроид поможет узнать, что же интересного и нового идет по телевидению. Как государственные каналы, так и кабельное ТВ – все программы с временем и датами можно найти в соответствующей вкладке и контролировать свое телевидение, чтобы не пропустить любимую передачу.
Афиши же покажут ближайшие выходы фильмов и спектаклей, что идет сейчас на сцене и экранах, где что можно посмотреть и в какое время. Очень удобно, когда желание сходить в кино застало внезапно, в пути, когда с собой есть только смартфон или планшет.
Также рядом всегда можно найти то, что необходимо: магазины, достопримечательности, аптеки, рестораны, бары и клубы. Все это будет отмечено на картах и поможет добраться до нужной точки.
Также скачать приложение Яндекс на андроид бесплатно стоит по тому, что оно поддерживает голосовой поиск, что очень удобно в пути, когда нет времени вбивать необходимые запросы при помощи клавиатуры. Для тех же, кто не любит голосовой поиск, Яндекс угадывает запросы еще с первых вводимых слов, предлагая свои варианты. Безумно удобная облегчит жизнь тем, кто находится постоянно в пути и не может следить за всем с большого экрана. Это удобное приложение не займет много места, но принесет много пользы активным пользователям интернет-пространства.
Яндекс.Поиск – удобное приложение, которое поможет вам найти все, что вы захотите, нужно лишь сказать или ввести запрос, а дальше программа сделает все за вас.
После установки Яндекс.Поиск в верхней панели уведомления у вас появиться отдельная колонка для быстрого поиска, а также информация о пробках, погода, курс доллара и евро на текущий момент. Очень удобно, если вы любите, что-то искать, то больше не придется заходить в браузер, ведь можно просто выдвинуть шторку и начать быстрый поиск.
Поиск представлен в виде одной строки, где можно ввести запрос с помощью клавиатуры или же воспользоваться голосовым вводом. В настройках программы вы сможете: очистить историю, включить/отключить сохранение истории, а также изменить параметры панели уведомлений (вышеперечисленные параметры).
Для удобства использования в программе есть информативные виджеты трех размеров (2х1, 4х1 и 4х4). В самом большом виджете отображается: поисковая строка, новости, погода, а также приложения, которые можно запускать прямо с виджета (при желании можно изменить список программ). Понравилась программа? Тогда вам следует скачать Яндекс.Поиск на Android бесплатно прямо сейчас!
Ссылка для загрузки взломанной программы Яндекс.Поиск:
Яндекс. Поиск полная версия на русском: (cкачиваний: 1006)
Яндекс ставит машинный перевод в основу новой стратегии искусственного интеллекта
7 февраля 2017 года Яндекс объявил о создании подразделения машинного интеллекта и исследований (МИР) и назначил Мишу Биленко его руководителем. До декабря 2016 года Биленко был главным исследователем и руководителем группы в Microsoft, где проработал более десяти лет.
Яндекс часто называют «русским Google», а его основателя и генерального директора Аркадия Воложа сравнивают с Ларри Пейджем из Google. Доминирующая поисковая система в России также выиграла от проблем Google.
Показательный пример: в прошлом году антимонопольный орган страны вынес решение против Google и наложил на нее штраф в размере 6,8 млн долларов США за недостаточное открытие Android для местных конкурентов (например, Яндекса). Александр Шульгин, главный операционный директор Яндекса, сказал, что доля компании в Android-устройствах «снова начала расти… в результате новых дистрибьюторских сделок», которые последовали за постановлением.
Как бы то ни было, эксперты ожидают, что Яндекс всегда будет вести тяжелую битву с Google; не только в области устройств, но, что более важно, в среде машинного перевода.
Мы связались с Яндексом, чей представитель немедленно повторил идею Google о том, что «всегда нужно получить достаточно данных», заявив, что Яндекс является «одной из немногих компаний в мире, имеющих доступ к достаточному количеству данных, чтобы соответствовать сегодняшним стандартам качества для машинный перевод.»
Служба бесплатного перевода Яндекса обрабатывает более 10 миллионов запросов в день — официальный представитель Яндекса
Согласно веб-сайту Яндекса, машинный перевод — это одна из четырех основных областей машинного обучения, входящих в состав подразделения МИР; другие — распознавание изображений, распознавание голоса и платформа машинного обучения.
Объединив возможности для создания дополнительного функционала, компания приступила к тестированию перевода изображений через Яндекс. Переводчик. По словам представителя, они также интегрировали речь в свою службу машинного перевода, чтобы пользователи могли запускать функцию преобразования речи и прослушивать переводы. Тот же источник сообщил, что бесплатная служба перевода Яндекса обрабатывает более 10 миллионов запросов в день.
Превзойти Google по цене
Платный сервис компании, Yandex.Translate API, взимает 15 долларов США за миллион символов от 0 до 50 миллионов символов в месяц, и эта сумма снижается до 6 долларов США после 500-миллионного символа.
Google взимает 20 долларов США за миллион символов за 0–1,5 миллиарда символов в месяц, а при взломе 1,5 миллиарда эта сумма снижается до 15 долларов США за миллион символов. Тем временем Microsoft взимает 10 долларов США за миллион символов.
Команда Яндекс.ПереводчикаПодробнее о Neural Скоро
По словам представителя Яндекса, они начали интегрировать модели на основе нейронных сетей в Яндекс в середине 2016 года, но их основная технология по-прежнему остается статистической. Источник пообещал, что у Яндекса «будет чем поделиться» о нейронных моделях в будущем.
На вопрос о новом подразделении источник сказал, что МИР представляет собой «централизацию существующих команд в одно объединенное подразделение», и, кроме найма Биленко, его создание не создало никаких немедленных вакансий. Короче говоря, скорее внутренняя реорганизация, чем массовое наращивание.
«Яндекс.Переводчик базируется в штаб-квартире Яндекса в Москве, которая является одним из 17 офисов Яндекса по всему миру. Больше половины команды Яндекс.Переводчика составляют разработчики, а также аналитики, тестировщики, менеджеры проектов и другие специалисты службы поддержки», — рассказали в пресс-службе.
Битва в гору
Исследователь языковой индустрии Константин Дранч, управляющий русскоязычным веб-сайтом translationrating.ru, прогнозирует, что Яндекс будет стремиться к лидерству в бесплатном общедоступном машинном переводе. Он сказал Slator: «У них есть много каналов для его продвижения (браузер, порталы), поэтому в конечном итоге они, вероятно, станут больше, чем [конкурент] PROMT, но всегда будут вести тяжелую битву с Google».
Яндекс незначительно опережает Google по объему поиска с долей 55,2%
Как бы то ни было, Яндекс чуть-чуть опережает Google по объему поиска с долей 55,2%, основанной на статистике LiveInternet.ru, которую цитирует Дранч.
О другом конкуренте Яндекса, ABBYY, Дранч сказал, что их машинный перевод «не является общедоступным, хотя базовая технология Compreno получила много инвестиций и получила широкую огласку три года назад».
Зачем чеченский, если можно сделать клингонский?
Дранч отметил, что Яндекс предлагает множество сервисов, которые копируют сервисы Google: карты, онлайн-хранилище, торговую площадку, пакет веб-аналитики и так далее.
«Если у вас есть Яндекс-почта, Яндекс-браузер, вы выполняете поиск на Яндексе и ежедневно проверяете там новости, вполне естественно использовать Яндекс-переводчик, а не гугл-переводчик», — отметил он.
Как Яндекс справляется с Google по качеству машинного перевода для EN-RU? И то, и другое одинаково плохо или хорошо — Константин Дранч
Когда его спросили, как обстоят дела с Google в плане качества машинного перевода для англо-русского, он язвительно заметил: «И то, и другое одинаково плохо или хорошо».
Он добавил: «Борьба за потребителей ведется на уровне маркетинга и возможности встроить предложение в приложения и устройства пользователя. У Google есть преимущество, потому что они контролируют ОС Android».
Что касается возможностей Яндекса в MT, Дранч советует добавить возможности обучения движку, аналогичные Microsoft Translator Hub. «Это позволит им создавать корпоративные движки со специализированной терминологией и выходить на рынок B2B», — пояснил он.
Дранч сказал, что и Яндекс, и Google уже предлагают основные языки стран бывшего СНГ, такие как украинский, казахский, таджикский и грузинский. Хотя существует много более мелких языков и у Яндекса есть преимущество, он сказал, что с точки зрения трафика и финансовой выгоды он не видит в них большой разницы, поскольку «80–9В любом случае 0% всех запросов с русского на английский, французский и немецкий».
Возможно, Яндекс захочет добавить чеченский перед клингонским
Руководитель отдела развития бизнеса PROMT Юлия Епифанцева сообщила Slator, что большинство языков бывшего СССР для сегмента B2C уже охвачены. Что касается B2B, особенно с использованием машинного перевода в правительстве или юриспруденции, она отметила: «Онлайн-сервисы ничего не могут предложить, потому что этим организациям обычно нужны решения для офлайн-перевода».
По словам Дранча, следующим по величине языком является чеченский, на котором говорят более миллиона человек. «Возможно, Яндекс захочет добавить его раньше, чем клингонский, квенийский и дотракийский. С другой стороны, возможно, нет», — сказал Дранч, имея в виду стремление Яндекса превзойти Google в предложении непонятных языков.
О том, является ли решение Яндекса объединить Яндекс.Переводчик с более широким подразделением МИР, Дранч заключил: «Машинное обучение имеет множество применений, не только перевод — и имеет смысл дать новому подразделению с отличным наймом немного больше возможностей».
Примечание редактора. В предыдущей версии этой статьи цитаты из Яндекса приписывались Мише Биленко, руководителю отдела машинного интеллекта и исследований Яндекса
Яндекс запускает голосовой перевод с использованием нейронных сетей
7 сентября Яндекс представил новый инструмент — автоматизированный голосовой перевод англоязычных видео с YouTube, Vimeo, Facebook и других сайтов на русский язык. Он доступен через Яндекс.Браузер, что позволяет работать с видео, размещенными на любом сайте.
Перевод занимает всего пару минут: нейросети Яндекса обрабатывают речь, превращают ее в текст, синтезируют русский перевод и синхронизируют с видео. Они также умеют определять пол говорящего с помощью биометрии и выбирать соответствующий голос. При этом такие характеристики речи, как эмоции, интонации, паузы, членение фраз, должны оставаться прежними.
ИТМО.НОВОСТИ взяли интервью у Законова Андрея , экс-руководителя проектов Яндекса «Алиса» и «Умные устройства», выпускника факультета информационных технологий и программирования Университета ИТМО (ранее факультет компьютерных технологий — прим. ), который придумал идею для переводчика озвучивания и запустил проект в Яндекс.
Я был главой команды Alice and Smart Devices, и этот новый продукт тоже родился там. Сначала мы создали первоначальный прототип, а затем стали приглашать коллег из других отделов для формирования новой команды.
Аналогичные задачи мы решали при работе над Алисой — нужно было научить ее распознавать человеческую речь и делать это быстро. За доли секунды он должен распознать речь, обработать, обобщить, интерпретировать ее и понять вопрос, а также найти ответ в сети и затем поделиться им вслух. Задача очень сложная, мы работали над ней несколько лет и в итоге сумели выйти на общение почти в реальном времени — это очень похоже на общение с человеком.
Тем временем команда Яндекс.Переводчика научилась переводить с английского на русский и делает это хорошо. Нейросеть не переводит отдельные слова, а распознает контекст, фразы и абзацы.
Итак, когда мы начали думать о том, как развивать нашу технологию, мне пришла в голову идея автоматического перевода видео. В принципе, необходимые технологии у нас уже были: мы умеем распознавать текст и голос, хорошо его переводить, а также синтезировать речь, чтобы сделать ее более человечной, эмоциональной и с правильными интонациями.
Осталось решить, как сделать инструмент максимально удобным для пользователей и сделать конечный продукт таким, чтобы им не нужно было заходить на отдельный сайт, вставлять ссылку и ждать результата. Именно тогда к нам присоединилась команда Яндекс.Браузера, потому что браузер был лучшим решением, позволившим нам объединить все наши технологии.
Эмоции через текст не понять – это речь, которая содержит иронию, сарказм, радость, раздражение и т. д. и поэтому для определения эмоций приходится использовать оригинальный трек. Но это больше похоже на планы на будущее.
Дело не только в том, чтобы просто прочитать все слова, это сложнее. В противном случае актеру пришлось бы записывать все русские слова — это огромный объем работы. Более того, постоянно появляются новые слова, термины и названия. Или, к примеру, Яндекс.Навигатор — там бесчисленное множество названий сел, улиц, топонимов и т. д.
Поэтому мы поступаем иначе – используем фонемы или даже их фрагменты, а затем формируем из них слова и предложения. Эмоции также добавляются во время постобработки. Одну и ту же фразу можно генерировать с разными эмоциями, а также с разной скоростью, чтобы она соответствовала звучанию видео — это тоже делается при постобработке.
Возьмем, к примеру, технологию переноса стиля — она очень популярна в области обработки изображений. Любую фотографию можно превратить в картину, похожую на картину Ван Гога или Сальвадора Дали, за счет наложения определенного стиля на изображение. То же самое можно сделать и с голосом: можно обучать модели на наборе данных фразами, произносимыми с радостью или грустью, и в итоге получить возможность передавать определенную эмоцию в синтезированную речь. Это очень интересная область речевых технологий, но пока она только начинает развиваться.
В текущей версии биометрия используется только для определения пола говорящего и выбора мужского или женского голоса. Следующий шаг — добавить больше типов голосов и научить модель их различать. Каждый голос, как и лицо, уникален и имеет узнаваемые черты.
Мы запустили интересную сопутствующую функцию в наших умных колонках: Алиса понимает, разговаривает ли с ней ребенок, и автоматически вводит возрастные ограничения, выбирает более смешные ответы и менее формальна.
Я много экспериментировал с разными видео. Есть жанры, в которых эта технология еще не работает должным образом. Хорошо работает, когда один спикер представляет что-то в формате лекции или несколько спикеров говорят в интервью. Но хуже работает, если много сленговых слов или эмоций. Например, популярный нынче жанр стриминга видеоигр часто включает в себя множество специфических слов и резкие бессвязные выкрики. Или какие-то влоги, где люди склонны говорить очень эмоционально.
Также плохо работает, когда несколько человек разговаривают одновременно. Перевод будет прочитан вслух в один голос, поэтому несколько говорящих сольются в один.
Есть много факторов. Во-первых, в англоязычных странах эта технология менее востребована, потому что контента на английском гораздо больше, чем на любом другом языке. Во-вторых, сейчас подходящий момент для появления такой технологии. Пять лет назад пользовательского контента было значительно меньше. Десять лет назад в таком инструменте не было необходимости, потому что большая часть видеопроизводства была профессиональной, что требовало больших денег, поэтому также был предоставлен профессиональный перевод.
В наше время ежедневно появляются тысячи отличных видео на разных языках и перевести их быстро и недорого невозможно.