Проверка орфографии
http://docs.kde.org/ | ||
Пред. | Основные действия | След. |
David Sweet (dsweet kde.org)
Salma Sultana
T.C. Hollingsworth (tchollingsworth gmail.com)
Перевод на русский язык: Олеся Герасименко
Рецензирование: Александр Яворский
Sonnet — это модуль для проверки орфографии, используемый такими приложениями KDE как Kate, KMail и KWord. Sonnet предоставляет графический интерфейс для различных инструментов проверки орфографии, распространяемых под свободными лицензиями.
Для использования Sonnet необходимо установить программу для проверки орфографии: GNU Aspell, Enchant, Hspell, ISpell или Hunspell, а также соответствующие словари для необходимых языков.
Проверка орфографии
Исправление орфографической ошибки.
Для проверки орфографии используйте меню Сервис → Орфография.
Слово, возможно содержащее орфографическую ошибку, будет показано в верхней строке диалога. Sonnet пытается подобрать подходящие слова для замены. Лучший, по мнению программы, вариант показан справа от текстовой метки Заменить на:. Для использования предложенного варианта замены нажмите кнопку Заменить.
С помощью Sonnet также можно выбрать нужное слово из списка предлагаемых слов и заменить им слово с орфографической ошибкой. Кнопка Похожие слова служит для добавления из словаря дополнительных вариантов в список возможных замен.
Нажатие кнопки Игнорировать сохраняет исходное написание слова.
Нажатие кнопки Готово завершает проверку орфографии и сохраняет все внесённые изменения.
Нажатие кнопки Отмена завершает проверку орфографии и отменяет внесённые изменения.
Нажатие кнопки Заменить все выполняет автоматическую замену всех вхождений слова с ошибкой выбранным для замены словом до конца документа.
Нажатие кнопки Игнорировать везде приводит к игнорированию этого и дальнейших вхождений слова, содержащего орфографическую ошибку.
Нажатие кнопки Добавить в словарь добавляет проверяемое слово в персональный словарь, после чего слово считается написанным верно.
Персональный словарь — это словарь, отличный от общего системного словаря, и добавленные в него слова недоступны другим пользователям.
Раскрывающийся список Язык в нижней части диалогового окна служит для временного переключения на словарь другого языка.
Автоматическая проверка орфографии
Во многих приложениях возможна проверка орфографии по мере ввода текста. Для использования этой функции выберите в меню Сервис → Автоматическая проверка орфографии.
Слова с возможными орфографическими ошибками будут подчёркнуты красным. Для выбора варианта замены наведите курсор мыши на подчёркнутое слово и нажмите правую кнопку мыши. В контекстном меню выберите нужное слово из списка пункта Проверка орфографии. Слово, отсутствующее в словаре, может быть исключено из проверки орфографии текущего документа выбором пункта меню Игнорировать слово или добавлением в персональный словарь выбором пункта меню Добавить в словарь.
Настройка Sonnet
Для смены словаря выберите в меню Сервис → Выбрать словарь. В нижней части текущего документа появится маленькая панель для выбора словаря.
Дополнительная информация о настройке Sonnet находится в разделе документации Модуль настройки «Проверка орфографии»
Благодарности
Благодарим участника «Google Code-In 2011» Salma Sultana за большой вклад в написание данного раздела.
Сервисы для проверки орфографии и пунктуации в текстах
Содержание:
До чего дошел прогресс?! Теперь, чтобы стать автором, не обязательно быть грамотным. Все, кто не получил Русского медвежонка 15 лет назад, дружно выдохнули. Вы же еще помните этот конкурс по языкознанию для школьников, который проводили по всей России? Да что Медвежонок, чтобы быть успешным автором можно было и ЕГЭ по-русскому на троечку сдать. Или нет?
Для чего нужны сервисы проверки текстов?
Незабвенный Александр Сергеевич завещал будущим поколениям авторов: «Глаголом жги сердца людей» А что же грамматика — дело второстепенное? Разумеется нет! Будем честны, человек, который пишет с ошибками, мгновенно теряет авторитет в глазах читателя. Какой бы прекрасный текст не был: с россыпью удивительных сравнений, уникальными мыслями и выверенным ритмом — внимательный читатель будет спотыкаться об ошибки. Впечатление испорчено, червячок сомнения закрался и мучает по ночам преданного фаната: «А точно ли я могу доверять любимому блогеру?»
Стоп! Жечь рукописи не нужно, посты тоже оставим. Даже если великий и могучий вам не поддается, выход есть — используйте сервисы проверки текстов. И грамотного редактора. Потому что и сервисы проверки текстов ошибаются.
Кому они понадобятся?
Только не комплексуйте. На самом деле, сервисы проверки текста на грамотность нужны даже самым матерым авторам. Причин много: банальная усталость, кто-то отвлек, и вы не заметили ошибку, авторская слепота наконец. Весьма любопытное явление, которым страдает каждый первый копирайтер. Ученые объясняют невозможность замечать свои ошибки тем, что наш мозг автоматически их исправляет, концентрируясь на содержании. Наверняка вам попадались картинки в сети с небольшим текстом на тарабарском языке, состоящим из симбиоза цифр и букв.
Сначала вы читаете с трудом, а финальная фраза: «Только небольшой процент людей на Земле смог дочитать этот текст до конца» совсем не вызывает у вас сложности, мозг адаптировался и не замечает подвоха. Также и с текстом. О, сколько раз я пропускала буквы в рекламных баннерах, с ужасом обнаруживая эту досадную ошибку уже после публикации. Хвала ВКонтакте, можно быстренько перезалить и никто ничего не заметит. С Instagram в этом плане гораздо сложнее. А после 16:00 мой мозг обычно отключается, и наступает время хаотичных перестановок и реверсии: лошачий каток, поворот не туда и прочие прелести утомленного сознания.
Онлайн-сервис проверки текстов нужен всем, кто причастен к работе с текстом: автору, редактору и контент-менеджеру, который постит публикацию. Лишняя проверка не помешает.
Помимо банальной проверки грамотности и пунктуации, у сервисов есть еще масса полезных функций:
- Уникальность текста — краеугольный камень в отношениях автор-редактор.
Если вы брали информацию из каких-либо источников, обязательно перепроверьте, нет ли в вашей работе плагиата. Большинство редакторов требует уникальность не ниже 95%. Лучше устранить проблему до того, как вы сдадите материал.
- Вода. Осторожно, не превышайте уровень воды в тексте, это грозит строгим выговором и повторной работой над публикацией.
- Заспамленность. Переизбыток ключевых слов приведет к тому, что поисковые роботы сочтут текст спамом. Алгоритмы постоянно меняются, сейчас для текстов свыше 4000 знаков допустимо значение заспамленности в 55 и даже 59%.
- Количество символов. Многие работают с Google Docs, и чтобы посчитать количество символов нужно сильно заморочиться. Проще воспользоваться бесплатным сервисом проверки текста.
- Стилистические ошибки. Есть сервисы, которые придут на помощь в борьбе с канцеляризмами и унылыми штампами.
Список и обзор каждого
text.ru. Довольно удобный онлайн-сервис, который посчитает количество символов, проверит тошноту, уникальность и орфографию. И все это бесплатно, если вы готовы ждать — в середине рабочего дня бывают очереди, которые обычно не занимают больше 10 минут. Можно получить ссылку на проверку уникальности, чтобы не кидаться в редактора скриншотами, но для этого понадобится зарегистрироваться. Сервис хорошо справляется с проверкой уникальности, так как не придирается к терминам. Чего не скажешь об орфографии — любит засчитывать за ошибку слитное написание сложносоставных слов.
LanguageTool помимо стандартной проверки грамотности и пунктуации, проверяет тексты на 20 языках. Его можно скачать или установить как расширение на Microsoft Word, Google Docs или в свой браузер.
Орфограммка — популярный среди редакторов сервис. Помогает найти даже сложные ошибки и подобрать удачные синонимы. Делает проверку и по SEO-параметрам. Бесплатной версии нет, зато есть два варианта оплаты: по объему и безлимитная подписка на месяц, полгода или год.
Главред стоит на страже грамотности стилистической: подчеркивает канцеляризмы, штампы, речевые ошибки, поясняет каждую, предлагает варианты замены и выставляет баллы. Хорошим баллом считается 7,5. Учитывайте, что Главред прежде всего сервис для оценки информационных текстов.
Сервисы — только вспомогательный инструмент в творческой мастерской автора, они не смогут заменить ценное обладание знаниями правил вычитки и фактчекинга. Еще лучше, если у вас есть живой редактор, вот его точно никто и ничто заменить не сможет. Ну а если редактора нет, можно им стать!
Постичь секрет написания стильных текстов можно на курсе «Коммерческий автор», а научиться редактуре на курсе «Редактура и фактчекинг». Но у нас есть предложение еще лучше: мы объединили два этих курса в один пакет! В два раза больше пользы и экономии. Это не просто выгодное предложение, это джекпот для начинающего копирайтера: вы научитесь и писать и проверять тексты — очень ценное умение для автора. Каждое занятие предполагает обратную связь, все домашние задания будут разобраны индивидуально. Учиться лучше не только на чужих ошибках, но и на своих. Главное, чтобы вы их быстренько устранили с нашими преподавателями.
API проверки орфографии Bing — проверка орфографии запросов
Помогите пользователям исправить написание, разделить бренд, имена людей и сленг при наборе текста.
используйте клавиши со стрелками, чтобы перемещаться по сводкам, и вкладку, чтобы сфокусироваться на доступном для фокуса содержимом внутри сводной секции.
- Проверка орфографии
- Проверка
Помогите своим пользователям проверить орфографию в строке поискового запроса перед отправкой поискового запроса.
УЗНАТЬ БОЛЬШЕ
Помогите своим пользователям проверить свои предложения или фразы.
УЗНАТЬ БОЛЬШЕ
Разрывы слов
Исправление проблем с разрывами слов с помощью одного флажка.
Сленг
Легко распознавать сленг и неформальную лексику.
Имена
Найдите распространенные ошибки в именах в контексте.
Омонимы
Исправление омонимов и других трудноуловимых ошибок в контексте.
Бренды
Обеспечить поддержку новых брендов и других придуманных выражений по мере их появления.
Надстройка статистики Bing
Информируйте о своих стратегических решениях с помощью надстройки Bing Statistics.
Посетите портал УЗНАТЬ БОЛЬШЕ
Microsoft Bing для торговли
Расширьте возможности поиска в розничной торговле с помощью Microsoft Bing for Commerce. Запросите консультацию, чтобы узнать, как машинное обучение и поиск на основе ИИ могут увеличить продажи.
УЗНАТЬ БОЛЬШЕ
Как купить
- Цены
- Получить подписку
- Руководство по обновлению с v5 до v7
Начало работы
- Документация
- Юридический
- Переполнение стека
Получить поддержку
- Создать тикет
- Обеспечить обратную связь
5 лучших API проверки грамматики и орфографии
Попробуйте Sapling API
API проверки грамматики
Средства проверки грамматики и орфографии имеют долгую историю как часть приложений для обработки документов. Сегодня простые системы существуют в наших браузерах, почтовых клиентах и даже в наших мобильных клавиатурах. Тем не менее, эти системы, как правило, не выходят за рамки базовой проверки орфографии и автокоррекции, и даже в этом случае они часто имеют удручающе низкую точность.
Сегодня популярные системы, такие как Grammarly, Microsoft Editor и Sapling, предлагают функции, выходящие за рамки встроенной проверки орфографии большинства приложений. Эти системы предлагают интеграцию с браузером и настольным компьютером и дают встроенные рекомендации для простоты использования.
Конечно, невозможно интегрировать все приложения или обеспечить индивидуальный подход для каждого приложения. Если универсальная интеграция не подходит для вашего приложения, вы можете рассмотреть возможность использования интерфейса прикладного программирования (API). Они позволяют вашему приложению взаимодействовать с существующей системой проверки грамматики и орфографии через стандарт связи.
Если вы погуглите «API проверки грамматики», вы получите много эзотерических результатов. В этой статье мы попытаемся обобщить наиболее полезные API. На данный момент это относится к API проверки английской грамматики, хотя в будущем мы планируем включить многоязычные предложения (Sapling поддерживает многие языки, которые вы можете найти здесь).
Интерфейсы прикладного программирования
Хотя API имеют богатую историю, в этой статье мы предполагаем, что API предоставляет набор веб- конечные точки приложения грамматики. Ваше приложение может отправлять HTTP-запросы к этим веб-конечным точкам, чтобы получить набор правок для определенного фрагмента текста.
Возможно, вы слышали об API REST . Sapling (и многие другие API) следуют стилю REST, но вам не нужно знать подробности REST, чтобы использовать эти системы.
Например, предположим, что ваше приложение имеет текстовый ввод, в котором один из ваших пользователей вводит текст: Helo world
.
Ваша система использует сторонний API для получения правок. Он отправляет следующий JSON на стороннюю конечную точку POST:
{
"query": "Helo world"
}
Затем в ответ возвращает следующий JSON:
{
"edits": [
{
"начало": 0,
"конец": 4,
"замена": "Здравствуйте"
},
{
"начало": 5,
"конец": 10,
"замена": "мир. "
}
]
}
Эти два редактирования исправляют первую опечатку, а также добавляют отсутствующую точку. Сторонний сервис обнаружил все необходимые вам правки. Затем ваша система должна отображать изменения на вашем интерфейсе для вашего пользователя любым способом, который вы считаете нужным.
Комплекты для разработки программного обеспечения
Обратите внимание, что в дополнение к API некоторые системы также предлагают SDK, которые еще больше упрощают интеграцию их системы. Например, Sapling предлагает SDK, который позволяет разработчикам интегрировать Sapling с 5 строками JavaScript. Подробнее о SDK мы сэкономим для отдельной статьи.
Создание собственного API
Прежде чем мы обсудим поставщиков, зачем использовать сторонний API вместо создания собственного? Например, существуют отличные библиотеки, такие как Stanza, для предварительной обработки текста, а также библиотеки глубокого обучения, такие как TensorFlow и PyTorch, которые позволяют вам обучать вашу собственную систему, и даже библиотеки более высокого уровня, если вы выбрали конкретную область. модель.
Есть несколько причин, по которым это сложно.
- Язык действительно сложный . Для каждого сценария, который вы можете придумать, где, по вашему мнению, уместно определенное редактирование, существуют десятки, если не сотни вариантов. Если вы используете эвристический подход, вы, вероятно, не рассматриваете многие из этих вариантов. Если вы используете подход, основанный на машинном обучении, вам потребуется много данных.
- Инженерам потребуется некоторое время, чтобы настроить и обслуживать систему, и инженеры дороже .
То же самое относится и к серверам, если вы будете использовать систему на основе машинного обучения, требующую большого количества вычислений. Вполне вероятно, что использование API будет не только более эффективным по времени, но и с меньшими затратами.
- У вас и вашей команды есть другие дела, на которых стоит сосредоточиться. Если коррекция грамматики и обработка естественного языка не являются основными компетенциями, вероятно, лучше вместо этого сосредоточить на специализированных предложениях вашей системы. Купить почти всегда дешевле, чем построить. Поскольку вы, вероятно, арендуете облачную инфраструктуру у AWS или Azure, вам также следует попытаться разгрузить другие сервисы.
Providers
As of early 2022, here are some common grammar checkers/writing assistant tools that offer API access:
- Bing
- Ginger
- LanguageTool
- ProWritingAid
- Sapling
We’ll use следующие общие критерии при оценке различных API:
- Обзор : Какой тип API предлагается? Выполняет ли он проверку грамматики и орфографии или исключительно проверку орфографии?
- Сильные стороны : Какие предложения даны и какова производительность с точки зрения точности и отзыва?
- Задержка : Сколько времени требуется этим системам, чтобы предложить типичный запрос? Это, конечно, будет зависеть от размера документа, но распараллеливание должно позволять масштабировать большие документы с задержкой, которая тогда является основным узким местом.
- Другие функции : Какие еще предложения или информацию помимо правок предоставляет система? Какие есть язык и варианты развертывания?
Давайте сначала кратко расскажем о различных системах.
Bing
API проверки орфографии Bing помогает исправить орфографию и сленг. Это особенно полезно для брендов и имен, поскольку также использует API поиска Bing.
Типы исправлений включают разрывы слов, сленг, имена, омонимы и бренды.
Дополнительную информацию об API Bing можно найти на веб-сайте Microsoft: https://www.microsoft.com/en-us/bing/apis/bing-spell-check-api
Ginger
API проверки грамматики Ginger позволяет пользователям встраивать систему Ginger в свои собственные приложения. Хотя подробностей мало, на их информационной странице упоминается, что она используется для проверки миллионов документов в месяц. Учитывая, что Ginger API предоставляет интерфейс, отличный от платформы Ginger, можно получить представление о производительности, установив одну из других интеграций Ginger, например, для браузера. Ginger — один из сервисов проверки грамматики, который существует дольше всех — он был основан в 2010 году — поэтому вы, возможно, уже пробовали его услуги и хотели бы попробовать API.
LanguageTool
LanguageTool — еще одна из самых популярных программ проверки грамматики, предлагающая рекомендации по грамматике, орфографии и стилю. LanguageTool поддерживает более 20 языков, хотя для некоторых языков доступно большее количество предложений. Его предложение API может быть размещено локально. Он также предлагает возможность указывать правила, которые следует и не следует применять, а также устанавливать словари.
ProWritingAid
ProWritingAid предлагает API для проверки грамматики и орфографии для системы, на которой также основан ее собственный продукт. Он предлагает SDK на нескольких языках, включая C#, JavaScript, Python, PHP и Java. Подобно Ginger, ProWritingAid — это популярное решение, доступное с 2012 года, поэтому вы можете быть пользователем и также захотеть использовать API. В дополнение к проверке грамматики и орфографии ProWritingAid также предлагает конечные точки тезауруса и текстовых тегов.
Sapling
Sapling — помощник по обмену сообщениями на основе искусственного интеллекта для бизнеса. Его технология основана на исследованиях Стэнфордской лаборатории искусственного интеллекта.
Самое последнее из описанных здесь решений, Sapling специально предназначено для бизнес-групп, таких как группы поддержки клиентов или внутренние отделы продаж.
Sapling использует подход, основанный на обучении, чтобы обнаруживать до 60 % больше ошибок, чем другие системы. Пользователи могут предоставить тестовый ключ API самостоятельно сразу после регистрации учетной записи.
Подробнее об API Sapling можно узнать здесь.
Сравнение
Мы включили таблицу ниже, суммирующую некоторые преимущества и недостатки различных систем.
Поставщик | Обзор | Сильные стороны | Задержка | Другие функции |
---|---|---|---|---|
Доступно с Azure.![]() | Высокомасштабируемая система, использует Bing Search API, многоязычная поддержка. | <0,3 секунды | Настройка кода рынка в дополнение к коду языка. | |
Ginger | REST API, диалекты английского языка. | Подробные метаданные для правок. | ? | Рекомендации по синонимам и словарям. |
LanguageTool | REST API, несколько языков. | Поддержка многих языков, возможность самостоятельного размещения. | <2 секунды | <2 секунды |
ProWritingAid | REST API, подробные категории ошибок. | REST API, подробные категории ошибок. | ? | Тезаурус, доступны SDK, теги текста. |
Саженец | Система на основе машинного обучения, разработанная для предприятия. Самостоятельно обслуживать. | Обучаемая система, которая выявляет сложные ошибки, самостоятельный хостинг, несколько языков.![]() | ~1 секунда | Доступны категории ошибок, самостоятельный хостинг и SDK. |
Сравнение поставщиков API.
Какое решение лучше?
Лучшее решение зависит от вашего варианта использования. Поскольку здесь есть много соображений, мы не будем давать рекомендации, кроме как попробовать каждый. Но, пожалуйста, рассмотрите следующий раздел об оценке.
Примечание по оценке
Иногда критерии оценки очевидны — например, чтобы оценить задержку системы, вы должны отправить текст разной длины и записать прошедшее время настенных часов.
Из разговоров с пользователями мы часто сталкивались с плохой практикой, когда дело доходит до оценки различных систем на точность и полноту. Часто пользователи начинают с ввода преднамеренных ошибок, таких как:
Helo howare u.
фдсафсдафдса.
Кажется естественным, что система проверки правописания и грамматики должна помечать эти ошибки.
Этот подход, однако, отдает предпочтение строгим подходам, таким как те, которые используют простые словари и таблицы поиска — назовем их классические подходы — вместо подходов, основанных на обучении на реальных данных — мы назовем эти подходы, основанные на обучении .
Подходы, основанные на обучении, обучаются не на преднамеренных ошибках, а на реальных ошибках, наблюдаемых на практике, и, следовательно, могут работать хуже, чем классические подходы, на явных ошибках, таких как в приведенном выше примере. Однако, если учесть фактическое использование, подходы, основанные на обучении, как правило, фиксируют гораздо больше ошибок и дают больше полезных предложений.
Мы рекомендуем создать собственный набор данных для оценки, состоящий как минимум из нескольких десятков предложений, содержащих ошибки, путем сбора примеров предложений, которые видели вы или другие члены вашей команды. Эти примеры также должны быть репрезентативными для примеров, которые вы ожидаете в будущем.