Браузеры с функцией воспроизведения текста голосовым движком
Голосовые движки – это программное обеспечение, синтезирующее человеческую речь. Их используют для прослушивания книг, любой иной текстовой информации, на их базе работают голосовые ассистенты. Синтезированной речи пока что далеко до речи человека, голосовые движки ещё не могут передавать выражение, постановку акцентов, эмоции. Тем не менее они несут в себе решение для людей с аудиальным типом восприятия информации. Технология синтеза речи давно уже присутствует в среде Windows, более того, система поставляется со своими голосовыми движками. Эту технологию мы даже можем использовать при веб-сёрфинге для прочтения веб-публикаций в окнах браузеров. Не все браузеры поддерживают такую возможность, но у современных популярных она точно есть. Что это за браузеры? И как в них реализовано воспроизведение веб-публикаций голосовыми движками?
Microsoft Edge – родной браузер Windows 10 – во многом ещё далёк от уровня и потенциала Chrome и Firefox, но компания Microsoft активно совершенствует этот продукт. И в нём есть возможность воспроизведения текста синтезированной речью. Необходимо выделить блоком первое слово места, с которого нужно начать читать, и, собственно, запустить саму эту функцию.
Функция предусматривает отслеживание воспроизведения — синим блоком выделяется читаемый участок, жёлтым маркером отсвечивается конкретное воспроизводимое слово. Более эффектно отслеживание работает в режиме чтения Edge: здесь вся страница затеняется лёгкой вуалью, нетронутым остаётся только отслеживаемый блок.
Более того, в этот режим встроено иммерсивное средство чтения – специальный набор опций для обучения детей чтению, который компания Microsoft, заботясь о подрастающем поколении своих пользователей, нынче активно внедряет в свои продукты. Эти средства в комплексе с синтезированной речью можно использовать не только для обучения детей, но и для упрощения изучения взрослыми иностранных языков.
При воспроизведении текста можем переключаться на следующий/предыдущий абзац публикации кнопками «Next/Previous» или кликом мыши указывать конкретные места, с которых нужно начать читать. Речь настраивается: можем менять её скорость и выбирать голос диктора.
Минус Microsoft Edge заключается в том, что он позволяет воспроизводить текст только штатными движками Windows – мужским голосом Павла или женским Ирины. Они неплохи, но всё же далеки от идеала. Сегодняшний рынок IT-технологий может предложить более качественные решения, в том числе и в части русскоязычной синтезированной речи. Платные качественные движки, внедряемые в среду Windows, есть у компаний Acapela Group, Loquendo, Ivona. Но, увы, любые сторонние голосовые движки не поддерживаются браузером Edge. Зато их поддерживают другие веб-обозреватели.
Давно уже Mozilla Firefox хочет попасть в разряд браузеров «из коробки». Оставаясь по-прежнему дополняемым расширениями браузером, он тем не менее предусматривает ряд нативных пользовательских функций, причём реально годных функций. Одна из них – встроенный режим чтения с поддержкой воспроизведения текста. Воспроизводимая речь настраивается в части выбора скорости и голосового движка. Из таковых — встроенный в Windows диктор Ирина и установленные в систему сторонние движки. Воспроизведение можно переключать на следующий/предыдущий абзац кнопками «Next/Previous».
Воспроизводимый текст отслеживается выделением блоком читаемого абзаца и отметкой конкретного слова движимым курсором в виде нижнего начертания.
В числе нативного функционала Google Chrome нет ни функции воспроизведения речи, ни даже родного режима чтения. Но всё это легко можно организовать, установив в сам Chrome и браузеры на базе Chromium-платформы, которые работают с магазином контента Chrome, специальные расширения. Что это за расширения?
Reader View
Расширение Reader View – это реализуемый в браузерах Chrome, Firefox и Opera режим чтения с поддержкой функции воспроизведения текста. В Firefox и в Опере это расширение реализует точно такие же возможности, как и штатный режим чтения Firefox – отслеживание воспроизводимого текста, выбор скорости, кнопки переключения между абзацами. Более того, расширение Reader View в части реализации самого режима чтения схоже с этим режимом, встроенным в Firefox.
Расширение также позволяет выбирать голосовые движки из числа встроенного в Windows диктора Ирины и сторонних установленных в системе голосов. А вот в реализации для браузера Chrome Reader View может предложить ещё и дополнительные движки – качественную русскоязычную речь, разработку компании Google и голоса для других языков.
Для английского языка же и вовсе дополнительно поддерживаются движки iSpeech и SpeakIt!, работающие не на уровне Windows, а внутри самого Chrome за счёт реализации другими расширениями, например, SpeakIt!. Кстати, о нём.
SpeakIt!
Расширение SpeakIt! – это не режим чтения с функцией отслеживания текста, механизм воспроизведения текста здесь достаточно примитивный. Просто выделяем блоком текст, который нужно прочитать, и стартуем функцию. Далее всё, что можем сделать с этим процессом – это приостановить или выключить его.
Расширение SpeakIt! имеет внушительный перечень поддержки движков – как системных, так и реализуемых собственными средствами. Правда, для русского языка выбор невелик: родной диктор Windows Ирина, установленные в систему сторонние голоса и фирменный движок Google.
Ранее этот перечень был шире за счёт реализации ещё двух русскоязычных дикторов в составе движка iSpeech. Сейчас они почему-то не работают, но, возможно, ситуация поправится в будущем. Благо, расширение позволяет имеющиеся голоса моделировать на свой вкус — настраивать не только их скорость, но также высоту.
Runa Capital назвала 20 самых быстрорастущих стартапов на GitHub — Разработка на vc.ru
Венчурная компания выбрала разработчиков популярных репозиториев.
10 578 просмотров
Инвестиционный директор венчурного фонда Runa Capital Константин Виноградов выбрал 20 самых быстрорастущих разработчиков программного обеспечения с открытым кодом на GitHub.
Для исследования Виноградов собрал данные о репозиториях с оценкой от 1000 звёзд в начале и конце второго квартала 2020 года. В итоге он получил 24 тысячи хранилищ. При этом у 15% репозиториев было 51% звёзд, отметил он.
Также инвестиционный директор Runa Capital оценивал «вовлечённость» разработчиков, подсчитывая количество «вилок» — копий репозиториев (кто-то мог поставить звезду, но не воспользоваться хранилищем), и рост популярности репозитория в течение квартала. Чем больше звёзд и «вилок» у него было, тем быстрее он рос, выяснил Виноградов.
Топ-20 быстрорастущих стартапов на GitHub во втором квартале 2020 года Runa Capital
В двадцатку самых быстрорастущих вошли компании с количеством звёзд от 3700 и ростом свыше 25% за квартал. Большинство из них — бесплатные продукты компаний, которые не претендуют на статус «единорога», отметил автор исследования. 80% компаний созданы за пределами области залива Сан-Франциско, добавил он.
- Prisma, Германия. Инструменты базы данных для TypeScript и Node.js.
- Meili, Франция. API-ориентированное ПО для быстрого поиска.
- Cortex Labs, США. API-платформа для машинного обучения.
- Framer, Нидерланды. Программа для создания интерактивных инструментов дизайна.
- Streamlit, США. Фреймворк для быстрой разработки приложений анализа данных.
- Hugging Face, Франция. Разработчик библиотеки для обработки естественного языка Transformers и чатбота с ИИ для подростков.
- Pulumi, США. Платформа для разработки и развёртывания облачных приложений.
- ThingsBoard, Украина. IoT-платформа для сбора, обработки, визуализации данных.
- Genymobile, Франция. Решения для разработки и тестирования приложений для Android.
- Timber, США. Система облачной регистрации для разработчиков.
- N8N, Германия. Инструмент автоматизации рабочих процессов.
- Saleor, Польша. Платформа для электронной коммерции.
- Strapi, Франция. Распределённая система управления контентом.
- Brave, США. Безопасный браузер от сооснователя Mozilla Брендана Айка.
- Resemble, Канада. ИИ-инструмент для реалистичного копирования голоса.
- Volosoft, Турция. Инструменты для разработки ПО с открытым фреймворком ABP для ASP.net.
- Riot IM, Великобритания. Децентрализованные инструменты для безопасной связи.
- Iterative, США. Система управления версиями для наборов данных и моделей машинного обучения.
- Chatwoot, Индия. Чаты поддержки клиентов.
- Rasa, Германия. Текстовый и голосовой помощник на базе искусственного интеллекта.
Константин Виноградов добавил, что низкая популярность компании на платформе не говорит о том, что её продукт плохой.
Например, у nginx на GitHub всего 12,2 тысячи звёзд.Runa Capital
Голосовой поиск Google Chrome не работает у многих пользователей
Новые обновления добавляются внизу этой истории…….
Оригинальная история (опубликована 25 июля 2022 г.) выглядит следующим образом:
Google Chrome, запущенный в 2008 г., когда Интернет был еще в подростковом возрасте, является одним из самых популярных веб-браузеров на планете.
Что интересно, Chrome понадобилось всего 7 лет, чтобы свергнуть Internet Explorer и утвердить свое господство в качестве самого используемого браузера в мире.
И с увеличением числа пользователей, выходящих в Интернет с мобильных устройств, похоже, что Chrome сохранит свое лидерство в ближайшие годы.
Тем не менее, он далек от совершенства, так как многие в последнее время жалуются на ошибки и проблемы, такие как браузер, показывающий только один результат поиска, и отставание YouTube после недавнего обновления Chrome v103.
Проблема усугубляется тем, что многие пользователи Google Chrome сообщают, что функция голосового поиска не работает или не работает (1,2,3,4,5).
Похоже, функция голосового поиска распознает слово, но не вводит его в строку поиска, что делает его непригодным для использования многими.
Общие решения по устранению неполадок, такие как очистка кэша и файлов cookie, сброс настроек браузера и даже переустановка Chrome, не помогают решить проблему.
ИсточникХром «Голосовой поиск» не работает. Голосовой поиск срабатывает только при первом открытии приложения. После щелчка микрофона все выглядит нормально; мои слова вводятся в строке поиска, когда я их произношу, но затем страница не переходит ни к каким результатам, вместо этого Chrome ведет себя так, как будто вопрос никогда не задавался — даже слова, которые были произнесены и переведены из речи в текст в подсказка поиска сбрасывается обратно к тому, что было до того, как был инициирован голосовой поиск.
(Источник)
Голосовой поиск Google на моем рабочем столе внезапно перестал работать. Микрофон мигает, когда я говорю, поэтому он слышит, как я внезапно перестал отвечать. Он возвращается к четкому экрану поиска. Я проверил разрешения как в Google, так и в Windows 11. В оборудование не было внесено никаких изменений, я удалил и переустановил Chrome, но безуспешно. по поводу сломанной функции голосового поиска.
Мы надеемся, что вскоре они рассмотрят отзывы пользователей и в ближайшие дни выпустят обновление, которое устраняет проблему с неработающим голосовым поиском Chrome.
Будьте уверены, мы будем следить за дальнейшим развитием событий по этому вопросу и обновлять эту информацию по мере поступления дополнительной информации, поэтому следите за обновлениями.
16:26 (IST): По словам менеджера сообщества на форуме Google, проблема, из-за которой функция голосового поиска не работает в Chrome, теперь решена.
(Источник)Примечание : У нас есть больше таких историй в нашем специальном разделе Google, поэтому обязательно следите за ними.
Рекомендуемый источник изображения: Google Play Store
PiunikaWeb начинался как веб-сайт исключительно журналистских расследований, основное внимание в котором уделялось «срочным» или «эксклюзивным» новостям. Вскоре наши истории были подхвачены такими изданиями, как Forbes, Foxnews, Gizmodo, TechCrunch, Engadget, The Verge, Macrumors и многими другими. Хотите узнать больше о нас? Направляйтесь сюда.
Years of Brave терпит неудачу Голосовой поиск Google с ошибкой «Нет подключения к Интернету» — браузер
breinersj
#1
Я годами ждал, когда разработчики Brave исправят (или хотя бы объяснят, почему) браузер Brave неизбежно выдает ошибку «Нет подключения к Интернету» сразу после нажатия на значок микрофона голосового поиска Google. На протяжении многих лет было много жалоб и сообщений по этому поводу, но все они были автоматически «закрыты» и помечены как недоступные для ответов — без какого-либо значимого ответа от кого-либо из команды Brave. Я хотел бы отметить, что голосовой поиск отлично работает в браузере Google Chrome, используя то же подключение к Интернету, так что это не может быть проблемой.
Поскольку я набираю это, используя подключение к Интернету, Brave говорит, что у меня его нет, поэтому ошибка явно является результатом ошибки Brave — было бы здорово, если бы кто-то из команды Brave действительно ответил осмысленно. Я хотел бы отметить, что проблема была подтверждена еще в 2018 году (Голосовой поиск Google «Нет подключения к Интернету» — № 3 от Mattches) и ссылалась на несколько предыдущих отчетов, которые, по-видимому, были удалены из сообщества.
Если у вас возникла такая же проблема, пожалуйста, «ответьте» на это сообщение, желательно быстро, иначе приложение «Сообщество» может заблокировать эту ветку независимо от того, решена ли проблема. Может быть, если будет достаточное количество пользователей, мы сможем получить какой-то ответ.
Спички
#2
@breinersj,
Спасибо за обращение. Приносим извинения за неудобства. Короче говоря, этот вопрос рассматривается так: мы, по сути, выбираем между конфиденциальностью пользователя и удобством. Обратите внимание, что мы не очень довольны этим решением, но именно поэтому функция еще не реализована.У нас есть две проблемы Github с кучей соответствующих (и некоторых резких) комментариев по этой проблеме здесь:
github.com/храбрый/храбрый-браузерГолосовой поиск Google показывает «нет подключения к интернету»
ошибка приоритет/P4 веб-совместимость ОК/Да QA/Test-Plan-Specified аудио
## Описание ПРИМЕЧАНИЕ: это дубликат https://github.
com/brave/brave-bro…wser/issues/3725. Каждый раз, когда вы пытаетесь использовать голосовой поиск на рабочем столе Brave, отображается сообщение «нет подключения к Интернету». Это после разрешения доступа к микрофону вашего компьютера как для сайта, так и для самого Brave. ![изображение](https://user-images.githubusercontent.com/3299098/50357416-cab23800-050a-11e9-9cdc-3033b0ba7745.png) ## Действия по воспроизведению 1. Перейдите на https://google.com/ 2. Щелкните значок микрофона ![изображение](https://user-images.githubusercontent.com/3299098/50357473-eb7a8d80-050a-11e9-829b-06c74bc874f1.png) 3. Попробуйте выполнить голосовой поиск. ## Фактический результат: Отображается «Нет подключения к Интернету». ## Ожидаемый результат: Успешный голосовой поиск ## Воспроизводит, как часто: Всегда ## Версия Brave (информация о версии Brave://) v0.58.16 ### Воспроизводится в текущей версии: — Воспроизводится ли он в сборках для разработчиков и бета-версий браузера храбрых? Да, оба. ### Только проблемы с сайтом: — Проблема решается сама собой при отключении Brave Shields? Отрицательный — Воспроизводится ли проблема в последней версии Chrome? Неа! ### Дополнительная информация Ведет себя одинаково в системах macOS, Windows и Linux. github.com/храбрый/храбрый-браузер Невозможно использовать микрофон (касается Duolingo, Google Translate и других сайтов)
конфиденциальность приоритет/P4 веб-совместимость аудио заблокирован конфиденциальность/подключение ОС/рабочий стол
## Последний статус (этот комментарий отредактировал @bsclifton) Эта функция зависит от ключа S…peech API, который нам нужно будет создать и заплатить за каждое использование. [Как показано ниже] (https://github.com/brave/brave-browser/issues/3725#issuecomment-506915890), @tomlowenthal просмотрел это. На данный момент это приостановлено. У нас есть некоторые другие функции, требующие этого преобразования речи в текст. Но мы не предприняли никаких действий, так как создание токена и установка будут связаны с затратами. ## Детали оригинального выпуска от @MGRussell Эта проблема ранее была открыта в репозитории браузера и ноутбука [здесь] (https://github. com/brave/browser-laptop/issues/4476) и была заархивирована без разрешения с многочисленными ОС/версиями. Я снова открываю ее. здесь и отчет с Windows 7 с Brave версии 0.61.51 Chromium: 73.0.3683.75 (официальная сборка) (64-разрядная версия). [Это] (https://github.com/brave/brave-browser/issues/2802) может быть связанной проблемой, в которой упоминается, что Webspeech API отключен в Brave. ## Описание Браузер не работает должным образом с Duolingo. Сайт запрашивает разрешение на использование микрофона, и все, кажется, работает нормально, но, похоже, никакие данные от Brave не отправляются на сайт. Сайт официально поддерживает только Chrome, поэтому это необходимо исправить со стороны Brave, если браузер сможет использовать Duolingo. ## Действия по воспроизведению Браузер терпит неудачу во всех тестах Duolingo, которые просят пользователя отправить голосовые данные, в 100% случаев. ### Только проблемы с сайтом: Проблема не решается при отключении храбрых щитов. Эта проблема отсутствует в последней версии Chrome.
Тем не менее, я считаю, что самый полезный комментарий по поводу «почему» всего этого был сделан одним из наших руководителей по вопросам конфиденциальности (в то время):
Прежде всего: это не проблема с микрофоном — это API распознавания речи . Chrome поставляется с нестандартным API, используемым для распознавания речи. Веб-сайты, которые вызывают API, просят браузер расшифровать звук от имени веб-сайта и отправить сайту расшифрованный текст (не аудио). Когда сайт вызывает этот API в Chrome, Chrome отправляет необработанный звук на сервер Google для расшифровки. Сервер Google анализирует необработанный звук и отправляет транскрибированный текст обратно в Chrome. Затем Chrome передает текст на веб-сайт.
Здесь есть две проблемы. Простая прямая проблема заключается в том, что у Brave нет доступа к этой службе транскрипции Google. Это платная услуга от Google, которой Chrome может пользоваться бесплатно. Если бы Brave захотел его использовать, нам пришлось бы платить Google за эту привилегию. Вторая и гораздо более существенная проблема заключается в том, что я не думаю, что кто-то разумно ожидает, что щелкнет значок микрофона на Duolingo , что приведет к тому, что Brave отправит свой звук в Google 9.0008 .
Честно говоря, я думаю, что этот дизайн в Chrome абсолютно нелеп, и я был совершенно ошеломлен, когда узнал, как он работает. У нас было несколько разговоров с Google об этом, и результат более или менее (1) что они не видят, в чем проблема, и (2) они не предоставят нам доступ к этой онлайн-службе транскрипции, если мы заплати за это.
Таким образом, в результате Google встроил распознавание речи на сайтах Google, таких как Google.com и Google Translate, так что они зависят от нестандартного API в веб-браузере Google, который на самом деле просто обращается к службе транскрипции Google. Вам может быть интересно, почему Google.com и Google Translate просто не берут звук и не используют эту службу транскрипции Google за кулисами, а не используют этот сложный подход с участием браузера. Читатель, у меня точно такой же вопрос. Но в результате распознавание речи на этих сайтах Google работает только в браузере Google, и это может быть единственным ответом, который вам нужен.
К сожалению, я не думаю, что здесь есть какой-то путь вперед. Наш текущий план состоит в том, чтобы отключить некоторые вещи, чтобы значок микрофона не отображался. Очевидно, что это не лучшее решение: это больше похоже на сокрытие проблемы. Но я не знаю, что еще делать. И во всем виноват Google.
3 лайка
289 нед
#3
@Шоколад
Может вас заинтересовать. И Google Assistant может быть более поздней версией.
1 Нравится
Джейк или
#4
Отсутствие функции преобразования речи в текст мешает мне использовать Brave. Что касается опции преобразования речи в текст Google на их собственной веб-странице, я не использую ее, поэтому мне все равно, но я использую определенное расширение для преобразования речи в текст каждый день … несколько раз в день, так что без него , я должен пройти на храбрых. Что-то подсказывает мне, что недостаточно внимания было уделено поиску обходного пути.
Блог Rakuten RapidAPI — 22 февраля 1910 лучших API распознавания речи [2021] (более 20 проверенных)
Самые передовые API распознавания речи в 2021 году. Более 20 рассмотренных API распознавания речи. Зарегистрируйтесь и получите мгновенный доступ и бесплатные вызовы API. Плюсы и минусы
Стандартное восточное время. время чтения: 14 минут
К вашему сведению, это расширение, которое я использую… https://dictanote.