Голосовые помощники — обзоры для ПК, смартфонов, планшетов…
21 век — время технологий. Когда-то мы и представить не могли, что будут существовать “умные гаджеты”, значительно упрощающие жизнь человека. Однако всё меняется. Что такое Lenovo Smart Display?…
IFTTT – программа, позволяющая оптимизировать использование разных приложений на смартфоне. С ее помощью можно создавать удивительные рецепты, которые позволят превратить телефон в по-настоящему умное устройство. Кратко о IFTTT…
С каждым годом технологии развиваются все активнее. Ученые создают аппараты, которые упрощают жизнь человека. Google Nest Hub является одним из таких. Google Nest Hub что это? Чаще всего…
Carplay – компьютерная программа внедрённая в мозг машины и выполняющая функции информационно-развлекательного характера через дисплей и акустическую систему. Что такое Apple Carpley? Программистами компании Apple КарПлэй был доработан,…
В век информационных технологий любая крупная компания пытается расширять свой потенциал с помощью цифровых инноваций. Благодаря цифровым нововведениям, можно максимально внедрить автоматизацию различных процессов, повысить продажи, применять индивидуальный…
эволюция, устройство и основные игроки
Уточнить у Siri рецепт сырников во время готовки или попросить Алису прочитать сказку — вполне привычные для нашей жизни сценарии. А как это работает? Как звук превращается в понятные виртуальному помощнику команды, которые сразу же исполняются? Кто главные игроки на рынке? Какие еще заботы могут снять с нас голосовые помощники?
Редакция DTI Algorithmic собрала ответы на все эти вопросы — и помогали нам в этом наши программисты и союзники. В результате получился информационно насыщенный лонгрид, который мы будем публиковать по частям. Сегодня — про эволюцию голосовых помощников, их устройство и основных игроков на рынке.
Эволюция голосовых помощников
История голосовых ассистентов начинается с конца 1930-х годов, когда ученые начали предпринимать попытки распознать голос силами технологий. Тогда созданию качественного помощника мешали две большие проблемы:
- существование омонимов — слов с одинаковым звучанием, но с разным значением,
- постоянный шумовой фон, из которого система должна выбирать речь пользователя.
Сейчас для решения этих проблем разработчики используют машинное обучение. Оно учит нейронные сети самостоятельно анализировать контекст и эффективно определять основной источник звука. Однако пришли разработчики к этому не сразу — потребовалось как минимум 80 лет подготовительных работ:
1939 год. Советский физик Лев Мясников создал аппарат, способный распознавать человеческую речь — несколько гласных и согласных звуков.
1952 год. Сотрудники лаборатории Bell разработали механизм, который распознавал продиктованные по телефону числа от 1 до 9.
Первый голосовой распознаватель чисел, разработанный сотрудниками лаборатории Bell1962 год. Компания IBM представила собственную технологию распознавания речи — Shoebox. Машина распознавала 16 английских слов, 10 цифр и 6 арифметических команд.
Презентация системы распознавания речи Shoebox от IBM
1980 год. Инженеры научились применять методы «Скрытой модели Маркова». Со временем это позволило голосовым системам лучше распознавать речь. Они обрабатывают слово, учитывая несколько предыдущих и предсказывая, что может с ними сочетаться.
#справка Скрытая модель Маркова описывает генерацию случайных событий в зависимости от текущего состояния объекта. Пример: человек может находиться в одном из четырех состояний и не в каждое их них может перейти сразу (схема ниже). Например, если человек лежит, то он не может моментально пойти куда-либо — нужно сесть, встать и только потом идти
Пример физических состояний человека, описанных в скрытой модели Маркова1987 год. В США компания Worlds of Wonder начала продавать говорящую куклу Джулию, которая училась распознавать речь ребенка во время игры. В куклу был встроен процессор, который позволял ей реагировать и генерировать речь. Джули воспринимала восемь высказываний: «Джули», «да», «нет», «хорошо», «притворяйся», «голодна», «пой» и «молчи».
Реклама интерактивной игрушки — куклы «Джули»
1990-е годы. Появилась коммерческая программа Dragon Dictate, ориентированная на массовый рынок. Она распознавала речь и записывала надиктованный текст в файл.
1996 год. Появилось полноценное голосовое меню VAL от BellSouth. Система обрабатывала телефонные справочные запросы и помогала покупателям в поиске нужной информации об интересующих товарах.
Позже компания запустила Info by Voice — интерактивные голосовые «желтые страницы» с информацией о ближайших ресторанах, такси и некоторых магазинах. Система также могла рассказать о новостях и котировках акций, погоде, телепрограмме, гороскопе и спортивных событиях.
2001 год. Компания Microsoft добавила голосовой ввод текста в офисный пакет Office XP.
2002 год. Google запустил Voice Search — сервис для голосового поиска в интернете. Проект приостановили из-за неудобства использования — чтобы выполнить поиск, надо было позвонить на специальный номер. На Voice Search основан современный интерактивный помощник компании — Google Assistant.
2007 год. Центр исследования искусственного интеллекта SRI International начал разработку Siri. Siri стала первой голосовой помощницей — система умела не только искать информацию в интернете или работать как голосовое меню, но и вести с пользователем диалог.
2011-2014 годы. Google интегрировал функцию голосового поиска в браузер Chrome. Компания также запустила персонализированного ассистента Google Now с расширенными возможностями голосового поиска — сервис подбирал актуальную информацию с учетом местоположения пользователя, истории браузера и других поисковых запросов.
У Microsoft также появилась собственная виртуальная голосовая помощница — Cortana.
#интересное Ассистент Microsoft назван в честь персонажа из игровой серии шутеров Halo. Фразы для него записала актриса озвучки Джен Тейлор, озвучившая Кортану в игре
2014 год. Amazon представил первую в мире умную колонку Amazon Echo с голосовой ассистенткой Alexa.
Колонка с голосовым ассистентом — Amazon Echo2017 год. Alibaba представила умную колонку Tmall Genie с голосовым помощником AliGenie.
2018 год. Яндекс выпустил умную колонку Яндекс.Станция с голосовой помощницей Алисой.
2019 год. Банк «Тинькофф» запустил собственного голосового ассистента «Олега». Mail.Ru Group представила голосовую помощницу «Марусю».
Как устроены современные голосовые помощники
Голосовые помощники пассивно считывают все звуковые сигналы, и для активной работы им необходима активация при помощи кодовой фразы. Например, произнесите: «Окей, Google», потом можете задать свой вопрос или отдать команду без пауз.
Подробнее о работе голосовых помощников
Математик Ханна Фрай исследует, как работает программное обеспечение для распознавания голоса, используемое в в домашней технике.
В момент голосового запроса автоматическая система распознавания речи (ASR system) преобразовывает звуковой сигнал в текст. Это происходит в четыре этапа:
- Фильтрация. Система убирает из звукового сигнала шумовой фон и помехи, возникающие при записи.
- Оцифровывание. Звуковые волны преобразуются в понятный компьютеру цифровой вид. Параметры получаемого кода в том числе определяют качество записи.
- Анализ. В сигнале выделяются участки, содержащие речь. Система оценивает ее параметры — к какой части речи относится слово, в какой оно форме, насколько вероятна связь между двумя словами.
- Выявление шаблонов данных. Полученную информацию система включает в словарь — собирает разные варианты произношения одного и того же слова. Чтобы точнее распознавать новые запросы, ассистенты сравнивают слова в них с шаблонами.
Акустическая модель — как распознают речь в Яндексе
Если после обработки запроса виртуальный помощник не понимает команду или не может найти ответ, он просит перефразировать вопрос. В некоторых случаях могут понадобиться дополнительные данные — например, при вызове такси ассистент может уточнить местоположение пассажира и пункт назначения.
Основные игроки на рынке
По данным Microsoft, самые популярные голосовые помощники в США — Google Assistant, Siri от Apple, Alexa от Amazon и Cortana от Microsoft. Русский язык из них понимают только первые два, однако на российском рынке также работает Алиса от Яндекса, а на китайском — AliGenie от Alibaba. Сравнили основные характеристики умных колонок с поддержкой этих пяти голосовых ассистентов:
Голосовой помощник | Alexa | Google Assistant | Siri | AliGenie | Алиса |
Компания-производитель | Amazon | Apple | Alibaba | Яндекс | |
Активационная фраза | «Alexa» | «О’кей, Google» | «Привет, Siri» | «Tmall Genie» | «Привет, Алиса» |
Позиционирование | управление умным домом | поисковик | музыкальная колонка | управление умным домом | музыкальная колонка |
Решаемые задачи | управление умными устройствами; взаимодействие с товарами и сервисами Amazon; дозаказ новых продуктов; справочная информация | управление умными устройствами; поиск информации в интернете; справочная информация | управление умными устройствами; поиск информации в интернете; цифровая няня | управление умными устройствами; управление медиа; заказ продуктов в интернет-магазине Tmall | обработка голосового запроса; управление медиа |
Интеграция с социальными сетями и почтовыми сервисами | нет | нет | да | нет | да |
Понимает команды и произвольную речь | нет | да | нет | нет | да |
Мобильное приложение | Android, iOS | Android, iOS и браузер Chrome | Android, iOS | Wechat, Webao | Android, iOS и Яндекс браузер |
Язык | английский; французский; немецкий; японский; испанский; хинди | порядка 30 языков | 21 язык,включая диалекты | китайский; английский; русский | русский |
Стоимость станций голосовых помощников | $50—$150 | $50—$400 | $350 | $74 | $160 (₽9900) |
Доля рынка | 31,8% | 22,8% | 4,9% | 9,5% | менее 4,9% |
Продажи | 13,7 | 11,5 | 1,6 | 2,8 | менее 4,9 |
Typle программа для голосового управления компьютером
Персональные компьютеры прочно вошли в нашу жизнь. На начальном этапе появления таких агрегатов, человечество поверить не могло в их существование. Однако сегодня никого не удивишь наличием компьютера в доме. Это, словно обычная вещь, как телевизор кровать и так далее. Наша жизнь упрощается с каждым днем. Голосовой помощник для управления компьютера тоже считается еще одним решением для упрощения нашей жизни.
Голосовой ассистент Typle — что это такое?
Typle – голосовой помощник, созданный для операционной системы Виндовс 7,8 и 10. Приложение является простым, как в интерфейсе, так и в использовании. Программа имеет ограниченный функционала: поиск любой информации в Интернете и запуск приложений, которые установлены на компьютере.
Разработчики сделали две версии программы: платную и бесплатную.
На каких устройствах и каких операционных системах работает Typle?
Голосовой ассистент работает на ноутбуке и персональном компьютере с операционной системой Виндовс 7,8 и 10.
Функции ассистента Typle?
У программы слишком маленький и ограниченный функционал: открывание программ и приложений, установленных на персональном компьютере или ноутбуке. Еще открывает страницы в Интернете.
Как скачать и установить приложение Typle?
Голосовой помощник можно скачать на просторах Интернета. Только помните, что не все сайты могут гарантировать безопасность вашему компьютеру/ноутбуку после установки голосовой программы.
Для загрузки голосового ассистента зайдите в любой браузер. В поисковой строке наберите «Скачать голосовой ассистент Typle». Спустя несколько секунд
на экране вашего устройства появится список, состоящий из различных сайтов. Зайдите на любой и нажмите на кнопку «Скачать». Начнется загрузка. Все.
Настройка голосовой программы. Как пользоваться?
После того, как загрузка закончится, открываем приложение. Теперь мы будем настраивать его.
На экране компьютера появляется окно, где просят вести свое имя и произнести слово. Здесь нужно нажать на красную кнопочку для того, чтобы произнести слово. Это делается для того, чтобы помощник запомнил ваш голос.
Включите обязательно микрофон. После того, как все вышеперечисленное будет вами выполнено, нажимаем на кнопку «Добавить».
Теперь выбираем галочкой те команды, которые понадобятся вам. После нажимаем кнопку «Начать говорить». Это нужно для того, чтобы проверить правильность работы выбранных команд. Затем делаем аналогично с другими командами.
Не работает приложение, ошибки в приложении
Бывает, что свои функции приложение не выполняет из-за того, что не может распознать голосовые команды пользователя. Такое случается, если не подключен Интернет или микрофон.
Какие языки поддерживает голосовой помощник Typle?
Голосовой помощник поддерживает русский и английский языки.
Как управлять компьютером голосом | Компьютер для чайников
Голосовые помощники способные управлять смартфоном или планшетом давно вошли в нашу жизнь и упрощают взаимодействие с гаджетом. Google Now и Siri способны искать в интернете информацию, ставить напоминания, вызывать номер из списка контактов, делится фотографиями и даже изменять настройки телефона.
Но что же насчет компьютера? Современные рабочие станции способны за считаные минуты обрабатывать 4К видео, моделировать сложные 3Д элементы и выполнять сложные операции, однако мы редко слышим о голосовых ассистентах для Windows. На самом деле многие компании, в том числе и Microsoft развивают системы голосовых помощников, помогающих при работе с компьютером. Сегодня мы расскажем вам о лучших подобных проектах.
Cortana от Microsoft
Голосовой помощник для Windows 10 Cortana входит в стандартную версию системы. Он позволяет выполнять поисковые запросы в интернете на компьютере, открывать программы и папки, изменять и удалить файлы, ставить напоминания и выключать компьютер. Cortana – это полноценная замена стандартному управлению Windows, заменяющая мышь и клавиатуру на голосовые команды. Поскольку помощник разработан самой Microsoft, он получил глубокую интеграцию с операционной системой и является лучшим решением для голосового управления Windows. Cortana имеет серьезный недостаток — она не поддерживает русский язык! Если вы владеете одним из этих языков: английский, немецкий, французский, испанский, итальянский, китайский, японский, португальский, то можете смело протестировать разработку от Microsoft на своем компьютере, при условии установленной Windows 10. Для этого выполните следующие действия:
- Откройте меню «Пуск», перейдите в «Параметры»
- Выберите пункт «Время и Язык»
- Перейдите в «Регион и язык»
- Выберите один из регионов, где используют нужный вам язык. Вам предложат скачать новый языковой пакет, согласитесь с этим.
- Перезагрузите компьютер.
- В меню поиска Windows напишите Cortana, нажмите на появившейся результат и включите ассистента в меню.
Microsoft не анонсировали дату релиза русскоязычной версии Cortana, поэтому использовать комфортно ассистент практически невозможно. Также, из-за специфики акцента у русскоговорящих пользователей, помощник не всегда понимает голосовые команды. Перейдем к другому приложению, поддерживающего русский язык.
Программа Laitis
Программа Laitis позволяет гибко настроить действия в проводнике Windows, браузерах, выбрать управление на различных сайтах соцсетей и других программах. Также вы можете с помощью макросов настроить управление элементами умного дома. Чтобы установить приложение выполните следующие действия:
- Перейдите на официальный сайт Laitis, найти его можно выполнив поисковый запрос в окне браузера.
- На сайте проекта согласитесь с лицензионным соглашением и загрузите бесплатную демоверсию.
- Запустите скачанный файл.
- Нажмите подтверждение, следуйте всем инструкциям установщика.
- Откройте программу, перейдите в меню «Команды». Вы увидите полный список команд для голосового управления. В Меню «Настройки» можно добавить программу в автозагрузку системы и выбрать подходящие настройки.
Приложение Laitis удовлетворит требования любого пользователя, желающего использовать голосовые команды для управления своим компьютером. Программа предлагает гибкую настройку индивидуально под требования каждого пользователя. Если вы не хотите долго настраивать и вникать в настройки приложения, то предлагаем перейти к простому варианту.
Яндекс Алиса для Windows.
Яндекс Алиса, это не полноценное средство управления компьютером, однако она позволит быстро найти требуемую информацию в интернете или на компьютере и поддерживает элементарные функции управления питанием системы – выключить, перезагрузить или завершить сеанс. Главным плюсом отечественной разработки можно назвать простоту использования. К сожалению Яндекс удалили с главного сайта Алису для Windows, там вы найдете только Яндекс браузер со встроенным голосовым помощником, поэтому мы нашли полноценную рабочую версию ассистента. Перейдем к установке приложения.
- Качаем файл установки Скачать Алису для Windows.
- Запускаем установочный файл, нажимаем далее. После установки приложению потребуется около 30 секунд для автоматической настройки.
- На панели быстрого запуска появится строка Алисы. Теперь вы можете перейти к настройкам приложения, например, можно выбрать любой браузер по умолчанию, отключить голосовые подсказки помощника, включить миниатюрный режим иконок или выбрать желаемые функции.
Подробное описание всех возможностей ассистента от Яндекс вы найдете на специальных вкладках помощника «Навыки» и «Вот что я умею». Помимо этого, Алиса умеет открывать файлы и программы Windows. Такого функционала хватит большинству пользователей, решивших упростить работу с компьютером.
NexxDigital — компьютеры и операционные системы
Голосовой ассистент для компьютера. Что такое Кортана? Обзор возможностей голосового помощника
По мнению специалистов, одной из самых удачных разработок программистов Виндовс 10 является интегрирование в операционку голосового ассистента Cortana. Подобные программы уже успешно работают на смартфонах, однако такое приложение в Windows 10 появилось впервые.
Для Российских пользователей главный недостаток Cortana состоит в невозможности программы разговаривать на русском. Кроме того даже с английским языком ее невозможно установить на ПК в нашей стране. Пока словарный запас ее ограничен английским, китайским и еще несколькими языками. Подправив несколько опций в 10-ке, возможно заставить работать Cortana и в России. В этой статье показано, как это сделать.
Функции Cortana
Cortana служит голосовым ассистентом для пользователя Windows 10, с помощью которого весьма удобно выполнять некоторые функции. Она может написать под вашу диктовку заметку или по голосовой команде сформирует напоминание, выяснит расписание самолетов, может включить необходимые программы и т.п. Также в ее способности входит возможность разговаривать с пользователем, шутить, напевать разные песенки и т.д.
Cortana в Windows 10 имеет функции поисковика. Причем программа успешно ищет информацию как в глобальной сети, так и в локальной памяти компьютера. Слушаясь ваших команд голосом, она включает приложения, работает с файлами и может редактировать опции Windows 10.
В каких странах функционирует Cortana?
Лишь ограниченное количество стран имеют возможность пользоваться данной полезной утилитой.
Она воспринимает и успешно беседует на следующих языках:
- китайский;
- французский;
- английский;
- испанский;
- итальянский;
- немецкий.
Поэтому, действует лишь в государствах, где данные языки главные. Создатели уверяют, что скоро Кортану смогут использовать все государства. Однако, пользователи, которые не могут долго ждать, имеют возможность задействовать «говорящего друга» на Windows 10 и в нашей стране.
Включение Cortana в РФ
Собственно помощник и его опции размещаются в месте поиска около клавиши «Пуск». Однако там появляется уведомление «Кортана недоступна», поскольку не подходят текущие языковые настройки ОС.
Для подключения Кортаны требуется сделать следующее:
Нередко поступают жалобы на некорректную функциональность Cortana, но проблема заключается не в приложении, а в акценте речи пользователей, т.к. утилита запрограммирована на понимание людей чисто говорящих на английском языке.
Заключение
Принципиально понимать, что, выполнив все шаги по подключению голосового помощника, программа будет функционировать лишь на одном из указанных выше языков.
В случае, если ваше произношение далеко от совершенства, то лучше не пользоваться Кортаной.
Специалисты говорят, о большой вероятности выпуска фирмой Microsoft программы с поддержкой русской речи, обосновывая наличием русскоговорящего пакета в дополнительных возможностях Windows 10.
Технический уровень : Базовый
Краткое содержание
При обновлении до Windows 10 Mobile многие пользователи заметили следующее: при нажатии кнопки Поиска на панели навигации открывается Edge, который перебрасывает на сайт Яндекса; отсутствует голосовой помощник; нет Кортаны на русском; кнопка Ночного режима на панели уведомлений не работает. В этой статье я опишу причины и возможные решения данных проблем.
Подробности
Как можно догадаться, все эти вопросы взаимосвязаны. Их всех объединяет работа (а точнее, её отсутствие) голосового помощника от Microsoft — Кортаны.
1) Что за Кортана и куда делся старый голосовой помощник?
Кортана — персональный голосовой ассистент, аналог Google Now на Android и Siri на iOS , однако гораздо более продвинутый. Она умеет всё — от открытия приложений, звонков, отправления сообщений и электронных писем до распознавания музыки, рассказывания анекдотов и интересных фактов и даже пения колыбельных. Единственное НО — на данный момент Кортана не переведена на русский (а тем более, на белорусский или украинский) язык и недоступна для соответствующих регионов.
В Windows Phone 8.1 была встроена обрезанная версия Кортаны, умеющая только открывать приложения и звонить. В Windows 10 Mobile почему-то даже такой обрезанный голосовой помощник был почему-то вырезан. То есть голосовой помощник на русском языке в W 10 M отсутствует!
2) Как здесь замешан Яндекс и его приложения?
Так как между Microsoft и Яндексом был заключён договор о сотрудничестве, некоторые приложения Яндекса предустановлены на смартфонах, в их числе и Яндекс.Поиск. Судя по всему, задумка была сделать так, чтобы пока нет Кортаны на русском языке, её частично заменял поиск Яндекса. Если вы не удаляли это приложение, то по нажатию кнопки поиска будет открываться именно оно.
Но я, честно говоря, видел маловато людей, которые не удалили это приложение. В таком случае по нажатию кнопки поиска будет открываться браузер, а именно страница Яндекса . Причины такого поведения неизвестны. Многих это раздражает. А обратно установить приложение нельзя, оно становится недоступным.
3) Как сделать так, чтобы при нажатии «Поиска» не открывался Edge ?
Я предлагаю следующее решение проблемы. Если в настройках телефона вы выставите регион «Соединённые Штаты Америки», при этом оставив язык и региональный формат так, как есть (то есть русский, белорусский, украинский), по нажатию кнопки поиска будет открываться обрезанная версия Кортаны, примерно как на десктопной Windows 10. Её функции будут сильно ограничены — если не ошибаюсь, можно будет только осуществлять поиск в интернете и на смартфоне. Но по-моему это лучше браузера с Яндексом.
4) Что за ночной режим и почему он не работает?
Ночной режим — это одна из возможностей полноценной Кортаны. Он отключает уведомления, есть возможность ограничить звонки и смс, в общем можно сделать всё, чтобы телефон ночью вас не беспокоил.
Проблема в том, что за данный режим целиком и полностью отвечает Кортана. Его настройки находятся именно в приложении Кортаны. То есть без неё его работа невозможна — обрезанная версия Кортаны, которая появляется при выставлении регионом США, также не обладает этим разделом.
Соответственно, нажатие на кнопку «Ночного режима» будет просто перекидывать вас в приложение, заменяющее Кортану. По умолчанию — это приложение Яндекс.Поиск, если вы его удалили — Edge с поисковым запросом, если вы выставили регион США, обрезанное приложение Поиска.
5) Когда выйдет Кортана на русском языке?
Несмотря на многочисленные запросы по этому поводу к Microsoft , никакой официальной, и даже неофициальной, информации нет.
6) Как включить Кортану на английском языке?
Если вы хорошо знаете английский язык и всё-таки хотите попользоваться Кортаной, специально для вас разработчики ОС не ограничивали возможность смены региона и языка смартфона.
Чтобы у вас появилась Кортана на английском, нужно сменить регион смартфона на США, язык и формат — на английский США. Сделать это можно в Настройках > Время и Язык. Сначала зайдите в Язык, измените его на английский США, смартфон попросит перезагрузку. Перезагрузите его. Затем зайдите в Регион, измените регион на США. Перезагрузитесь. Если необходимо, измените также и региональный формат и перезагрузитесь.
Если приложение Cortana не появилось в списке приложений, найдите в нём приложение Search и запустите. Приложение Cortana появится в списке приложений.
Также рекомендую в Настройках > Время и Язык > Время поставить галочку «Использовать 24-часовой формат», так как для США по умолчанию используется 12-часовой формат времени. Изменить меры длины, температуры (мили, градусы по Фаренгейту на километры и градусы по Цельсию) можно непосредственно в настройках Кортаны.
Данный способ будет также действовать для любого поддерживаемого Кортаной я