Операторы вордстат: Операторы Яндекс Вордстат — SEO на vc.ru

Содержание

Операторы WordStat с примерами использования

Широкое соответствиеОператор кавычкиКоличество слов в запросеОператор знак восклицанияОператор порядок словОператор илиОператор группировкаОператор минусОператор плюсСтоп словаСписок русских стоп словСписок английских стоп словКомбинирование операторовОператоры в других функциях wordstat

Операторы Вордстат (https://wordstat.yandex.ru/) – это специальные символы применяемые при подборе слов в сервисе wordstat с целью уточнения её смысла.

Операторы Вордстат представлены в виде символов, которые приписывают к словам и фразам для:

  • для уточнения условий показа по ключевому слову в Яндекс.Директ
  • для корректной формулировки запроса в поисковой система Яндекс
  • для получения более точных результатов подбора слов в wordstat.yandex.ru

Последнее наиболее ярко отражает работу операторов Вордстат и их значение.

Видео о том, как это сильно влияет на показ объявлений в Яндекс. Директ при использовании ключевых слова без операторов.👇

Словоформа – это (в понимании Яндекса) приставка + корень, без окончания, но это не совсем так. Чаще всего это число, падеж и время. И в этой статье определимся, что

  1. слово – это 1 слово (без пробелов)
  1. фраза – это несколько слов через пробелы

То есть при подборе выдаются фразы, которые содержат указанные слова, и фразы могут содержать указанные фразы (фраза + еще слова, которые употреблялись с фразой).

Широкое соответствие

При подборе фраз без использования специальных символов в левой колонке wordstat будут все фразы

  • включающие эту фразу
  • по всем словоформам
  • без учёта порядка слов в запросе.
  • без фиксации стоп-слов
Пример: вордстат

Именно в случае отсутствия любых операторов люди, которые никогда ранее не работали с wordstat не верно воспринимают результаты подбора и не корректно оценивают увиденное, и стало быть делают неправильные выводы.

Оператор кавычки

” ” – при заключении в кавычки фразы или слова фиксирует количество слов в запросе, при использовании этого оператора исключаются все фразы включающие эту фразу. То есть

  • будет показан запрос и его частотность без суммы частотностей фраз включающих ключевую фразу
  • не будет учитываться словоформа
  • не будет учитываться порядок слов
  • не фиксирует стоп-слова
Пример: ”вордстат”

Обратите внимание, что при использовании такого оператора у слова или фразы отсутсвует так называемый “хвост”, то есть фразы, которые содержат искомое слово.

Количество слов в запросе

Это не операторы Вордстат, но помогает сузить смысл используемой фразы за счёт ограничения количества слов во фразе. Работает только с оператором кавычки ” ” и использованием одинаковых слов в запросе.

Пример: ”вордстат вордстат вордстат вордстат”

Оператор знак восклицания

! – оператор фиксирует слово и его форму точно в том числе, роде, падеже и времени. При использовании этого оператора подбор фраз будет наиболее точным в плане смысла и окончания.

  • будет показан запрос и частотность и сумма частотностей всех запросов включающих ключевую фразу в этой словоформе
  • будут показаны все фразы включающие эту фразу в этой словоформе
  • не будет учитываться порядок слов
  • если поставить знак перед стоп-словом, то фиксирует стоп слово как оператор +

Пишется вплотную к слову, словоформу которого надо зафиксировать без пробела. Применяется к каждому слову во фразе, а не к фразе целиком.

Пример: !Москву

Оператор порядок слов

Оператор квадратные скобки.

[ ] – при заключении в квадратные скобки фразы или слова фиксирует порядок слов в запросе. Тот случай когда именно порядок слов в предложении или запросе имеет ключевой смысл. При использовании этого оператора

  • будут показаны запросы и их частотность, содержащие ключевые слова фразы именно в том порядке, который указан при подборе
  • будут показаны все фразы включающие эту фразу в этой словоформе и с этим порядком слов
  • при использовании квадратных скобок будут учтены стоп слова в запросе
Пример: [питер москва]

Оператор или

| – используется между словами или целыми фразами для получения выдачи подбора по нескольким отличным друг от друга фразам или словам.

Это вспомогательный оператор, который не несёт смысловой нагрузки на слова и используется для сравнения одновременно в выдаче частотности различных слов или целых фраз. Используется только вместе с оператором круглые скобки ( )

Пример: (шары | шарики)

Оператор группировка

( ) – при указании в круглых скобках фраз или слов, подбор слов водстат покажет их как единую смысловую единицу. Это вспомогательный оператор и используется с оператором “или | ” для более точной группировки единых по смыслу, но различных по написанию слов.

Пример: (мерседес | mercedes) (купить | цена | стоимость)

Оператор минус

– данный оператор нужен для исключения из выдачи вордстат ненужных результатов с использованием этого слова. Активно применяется в рекламных кампаниях Яндекс Директ для показа по нужным ключевым словам. Может применяться в при запросе в поисковую систему Яндекс.

Чтобы сработало надо после пробела от ключевой фразы или слова вплотную (без пробела) приписать к ненужному слову оператор –

Пример: ремонт квартиры -фото -своими -руками - самому -план

Оператор плюс

+ – это вспомогательный оператор для принудительного учёта стоп-стоп слов при запросе подбора в вордстат, использования в рекламных кампаниях Яндекс.Директ.

Стоп слова – это различные союзы, предлоги и междометия которые могут как не нести смысловой нагрузки, так и повлиять на смысл запроса. Полный список стоп-слов читайте ниже.

Для использования необходимо вплотную (без пробела) приписать к стоп-слову в запросе.

Пример: +на завтра

Стоп слова
Служебные части речи и местоимения, а также любые слова, не несущие дополнительного смысла, которые автоматически исключаются из запроса пользователя при отборе объявлений для показа.

Так определяет Яндекс стоп слова в своей справке. Стоит уточнить, что эти стоп слова сами по себе нее несут смысла и что они исключаются при выдаче, если вы не указали перед ними специальный оператор + и конечно же это справедливо не только для отбора объявлений Яндекс Директ, но и для подбора в Wordstat.

Пример: +так +же +и +также правило

Список ниже постоянно пополняется Яндексом и может быть не актуален на момент прочтения статьи, но это официальный список из справки.

Список русских стоп слов

Unknown block type: child_database

Список английских стоп слов

Unknown block type: child_database

Комбинирование операторов

Практически все приведенные выше операторы Вордстат можно комбинировать друг с другом для получения нужной именно Вам информации с максимальной точностью. Вот несколько примеров такого использования

(услуга | услуга) +наПример использования операторов когда нужно выяснить повод (причину), направленность, к чему используется товар или услуга.

Пример: заказать (шары | шарики) +на

(товар | товар) (+с | +из)Пример поиска слов с комплектацией товара, когда нужно сегментировать или понять с чем чаще всего или из чего должен состоять товар

заказать (цветов|букетов) (+из|+с) -доставка

Точный спрос по фразеПример для поиска абсолютной точности запроса и получение частотности только этих слов в этой словоформе и в этом порядке. Не автобуса, не из Тулы в Москву, а именно в таком порядке и с такими окончаниями

Пример:[!автобус !тула !москва]

Операторы в других функциях wordstat

Здесь мы рассматривали операторы вордстат только для левой колонки этого сервиса. На правую колонку мы не можем повлиять операторами. Так же следует отметить что операторы работают только для таких вкладок

  • по словам
  • по регионам

Для вкладки история запросов работает только оператор плюс «+»

О том как работает правая колонка yandex. wordstat, о функциях, ограничениях и правильного понимания выдачи подбора по запросам в других вкладках читайте в следующей статье.

Как пользоваться Wordstat — как работать с операторами Яндекс Вордстат и статистикой поисковых запросов

Как пользоваться Яндекс Вордстат, работать с операторами и статистикой поисковых запросов. Подробное руководство по работе с сервисом.

В этой статье мы расскажем:

  • как работать со статистикой поисковых запросов Яндекса с самых азов;
  • рассмотрим на примерах основные и дополнительные операторы;
  • научимся определять сезонность спроса;
  • дадим полезные советы по использованию софта, облегчающего работу.


Яндекс Вордстат – это бесплатный сервис компании Yandex, призванный помочь оптимизаторам и владельцам сайтов узнать, как люди ищут товары или услуги и собрать ключевые слова для продвижения сайтов.

Помимо этого, сервис позволит:

  • узнать частотность;
  • определить сезонность по каждому продвигаемому запросу;
  • определить спрос по конкретным регионам;
  • определить долю популярности фраз по устройствам (смартфон, десктоп, планшет).

Вы сможете собрать полное семантическое ядро и разработать структуру проекта. Сделать это проще с помощью специализированного софта, но вернемся к этому позже.

Начало работы

Для доступа к статистике сначала необходимо зарегистрироваться в Яндексе.

  • заведите почтовый ящик на Яндекс и авторизуйтесь;
  • откройте инструмент по ссылке https://wordstat.yandex.ru/.

Готово, можно приступать к работе.

Поиск по словам

Осуществляется поиск запросов, в которых присутствует введенная фраза (в левой колонке), а также всех похожих (в правой колонке). В колонке «Показов в месяц» выводится базовая частотность за последний месяц (суммарная частотность фраз из левой колонки).


Частота по регионам

Отражает частотность запроса в отдельности по регионам, во второй и третьей колонках отражена популярность в числовом и процентном соотношении.

Можно вывести списком и на карте для наглядности.


История запросов — сезонность запроса

С помощью этого инструмента можно проанализировать сезонность спроса по товару или услуге. Показывает популярность поискового запроса по месяцам или неделям. По скриншоту ниже видим, что спрос на услугу по «созданию сайтов» имеет значительный рост популярности в период с апреля по июнь.


Регион отображаемой статистики

Выбираем регион, статистика по которому нас интересует. При продвижении, скажем, по Москве – выбираем «Москва и область».


Инструмент позволяет сделать выгрузку по всей России, а также СНГ, Европе, Азии, Африке, Северной и Южной Америке, Австралии и Океании.

Статистика по устройствам

Вкладки «десктоп, мобильные, только телефон, только планшеты» содержат информацию с каких конкретно устройств наиболее часто вводят поисковый запрос.


Операторы Wordstat

Операторы необходимы для уточнения формулировки запроса и точного определения частотности ключевых фраз. Если ввести интересующие слова без применения специальных символов, то получим их базовую частотность, то есть – суммарную частоту поисковых запросов пользователей Яндекс с применением данной фразы.

Пример:

Частотность всех ключей со словом «велосипед» – купить велосипед, детский велосипед, трехколесный велосипед и т.д.


Ниже предлагаем рассмотреть основные операторы.

“Кавычки”

Фразы, зафиксированные оператором “кавычки”, например «создание сайтов», отобразят частотность только данного словосочетания без хвостов, во всех возможных формах и в любом порядке.


Сбор статистики запросов определенной длины

С помощью оператора “кавычки” можно вывести на экран статистику запросов, состоящих из заданного количества слов – из 2, 3, 4 и так далее.

Например, чтобы получить список ключей из 2 слов по фразе «велосипед», введите в Wordstat следующую конструкцию – “велосипед велосипед”.


В итоге получаем ключевые слова и базовую частотность по всем запросам из двух слов с заданной фразой. Данная конструкция применима для произвольного количества слов в запросе и любых тематик.

!Восклицательный !знак

Если перед введенными фразами применить оператор «восклицательный знак», то получите частотность по всем фразам с их присутствием именно в том виде и с тем окончанием, как вы ввели.


“!Кавычки !с !восклицательным !знаком”

Если совместить использование операторов Яндекс Вордстат “кавычки” и !восклицательный !знак, сервис покажет частотность четко по заданной фразе слово в слово, без учета порядка.


Дополнительные операторы

Операторы, предназначенные для более сложной сортировки данных при работе со статистикой запросов Wordstat.

[Квадратные скобки]

С помощью данной конструкции фиксируется порядок слов в запросе.

Пример – [стол для обеда]


Абсолютно точная частота запроса с учетом порядка, состава слов и окончаний.

Для получения точной частотности, используйте конструкцию вида – «[!стол !для !обеда]».


(Или|Или)

Вводится с применением вертикального разделителя “|” между словами и заключением их в круглые скобки. Чаще всего применяется, когда необходимо сравнить статистику по двум одинаковым по смыслу запросам, но с разным написанием.

Пример –

(Iphone|айфон), (сайт|вебсайт), (раскрутка|продвижение).


Таким образом, Вордстат показывает все ключи и число их показов сразу по обеим фразам – “iphone” и “айфон”.

Оператор “+”

Если перед любым словом указать символ «плюс», то оно становится обязательным для программы. Также его использование очень полезно для выделения предлогов, так как сам Вордстат их не учитывает.

Пример #1. Вводим поисковый запрос с предлогом


Как мы видим, инструмент проигнорировал наличие предлога и мы не получили статистику в том виде, в каком хотели.

Пример #2. Указываем перед предлогом «+»


Теперь видим, что в левой колонке все запросы содержат нужное нам слово.

С помощью данной конструкции удобно готовить контент-план для публикаций в блоге. Для этого используйте вместе с основным запросом вопросительные плюс-фразы: «как, зачем, почему, своими руками» и так далее.

Оператор “-”

Добавление символа “минус” перед словом поможет исключить все ключи с его участием. Можно добавлять неограниченное количество минус-фраз.

Например, вы хотите создать сайт веб-студии и ваш основной запрос «Создание сайтов». Вам необходимо оценить количество коммерческих запросов и их частотность для понимания целесообразности продвижения в данной тематике.

Для этого соберите список всех минус-фраз, либо найдите в интернете (существует множество готовых списков почти под любую тематику) и введите их все по данной конструкции: создание сайтов -бесплатно -самостоятельно -обучение -курсы и так далее.


Группировка запросов с использованием различных операторов

Пример конструкции:


В данному случае, мы сгруппировали фразы «seo, сео, поисковое, поисковая система, поисковик, яндекс, google» с фразами «продвижение, раскрутка, оптимизация» и убрали ключевые слова с вхождениями «бесплатно, самостоятельно, самому, инструкция».

Как автоматизировать работу со статистикой Вордстат?

Сбор семантического ядра через Вордстат для крупного ресурса или интернет-магазина – очень трудоемкий процесс. Его можно автоматизировать с помощью дополнительного программного обеспечения, сильно сэкономив свое время. Существует большое количество различного ПО для подбора, расширения семантики, анализа видимости конкурентов. Ниже перечислим самые основные и популярные.

1. Yandex Wordstat Helper

 – бесплатное расширение для браузера Chrome, с помощью которого вы сможете добавлять выбранные запросы в отдельное поле (нажатием на «+»), а потом копировать вместе с частотами одним нажатием кнопки.


Скачать его можно здесь

2. KeyCollector — инструмент для автоматического парсинга статистики с Wordstat. Использование КейКоллектор исключает необходимость ручного сбора и копирования. Для формирования полного семантического ядра вам понадобится только список базовых запросов:

    • вносите их в инструмент;
    • выбираете регион сбора статистики;
    • запускаете процесс.

Программе понадобится от нескольких часов до нескольких дней, в зависимости от количества ключевых слов в вашей тематике. После окончания сбора ядра необходимо произвести чистку от ненужных фраз и кластеризацию.

Но это уже тема для отдельной статьи.

2. Just Magic – содержит модуль парсинга статистики из левой колонки Wordstat с функцией поддержки всех операторов.

3. Букварикс – готовая онлайн база ключевых слов. Для моментальной выгрузки достаточно ввести базовые запросы и инструмент предоставит полный список необходимых вам фраз.

4. SpyWords – позволяет выгрузить видимость сайта конкурента в Яндекс и Google, определив по каким запросам его находят в поиске.

Итог

Надеемся, наша инструкция по Яндекс Вордстат помогла вам разобраться с сервисом. В этой статье мы рассказали о функциях и возможностях программы, а также упомянули инструменты, помогающие упростить и автоматизировать работу.

Еще мы помогаем с продвижением сайтов. Делаем полный анализ тематики вашей деятельности, составляем стратегию, оптимизируем ресурс для выхода в ТОП поисковых систем. Заполните форму ниже, мы вам перезвоним и проконсультируем.

Какие есть операторы для Яндекс Wordstat и как их использовать

Какой бы запрос мы не искали на wordstat.yandex.ru, надо уметь отсеивать лишнее и понимать какая настоящая частотность запроса, а не вся связанные с этим запросом ключи и словаформы.

Это полезно не только при сборе СЯ для SEO или контекстной рекламы, но и для оценки спроса на товар.

Пример запроса — «зеленый чай»

Может показаться, что это и есть спрос равный 266к запросам в месяц в одной поисковой сети, но на самом деле сам запрос «зеленый чай» искали 7к раз. Почему? — давайте разберемся!

Сбор СЯ (семантического ядра) очень долгий и кропотливый процесс и самое главное здесь две вещи:

  • собрать максимально широкое СЯ с использованием синонимов, сленговых выражений, различных словоформ, подсказок, подсветок, парсера СЯ конкурентов и др.
  • правильно определить частотность (это особенно важно в SEO, так как не редко ко мне обращаются клиенты, которые жалуются, что их «специалисты» продвинули сайт по ВЧ запросу, а продаж нет, но оказывается владельцу сайта показали НЧ запрос, по которому совсем нету трафика, а его было просто очень легко продвинуть. Клиент просто не умел правильно считать точную частотность

Содержание

  1. Зачем нужны операторы в Яндекс Вордстат
  2. Какие бывают операторы в Яндекс вордстат
  3. Оператор «плюс»
  4. Оператор «восклицательный знак»
  5. Оператор «кавычки»
  6. Оператор [квадратные скобки]
  7. Оператор «вертикальная черта и скобки»
  8. Оператор «минус»

Зачем нужны операторы в Яндекс Вордстат

Операторы — это специальные символы, которые используются для поиска нужной нам частотности в Вордстат. Без операторов Яндекс не учитывает словоформу, окончания, регистр, порядок слов и длину запроса.

Что касается длины запроса, то я имею в виду, что если вы хотите найти частотность того же запроса «зеленый чай», то вы получите общую частотность по всем запросам, где встречалось это словосочетание.

Например: запрос «зеленый чай» искали 266к раз, но сюда входит «как правильно заваривать зеленый чай» и сотни других запросов, а сам запрос «зеленый чай» искали всего 7к раз.

Более того, без операторов Яндекс будет объединять синонимы в один запрос и показывать общую частотность.

запросы синонимы

Так же и союзы, местоимения и другие слова, которые не несут смысловой нагрузки, как бы выбрасываются из запроса и не учитываются в показатели частотности. Для Яндекс это стоп-слова.

Представляете, если вы ищете частотность по запросу «вода для кулера», то Яндекс не поймет, что запросы «вода для кулера» и «кулер для воды» отличается

Еще Яндекс склеивает повторяющиеся слова

Оператор «плюс»

Этот оператор помогает закрепить наши стоп-слова, то есть слова, которые игнорирует Яндекс и просто выкидывает из запроса.

Достаточно добавить перед этим словом знак «+».

Пример: тур +на бали

Если без этого оператора Яндексу плевать на слово «на» и он подсовывает запрос «бали туры цены»

то с оператором «+» результат будет другой

Теперь частотность этого запроса сократилась с 10 404 до 6 871, потому что выкинулись запросы без слова «на».

Заказать настройку рекламы

Оператор «восклицательный знак»

Оператор «!» фиксирует форму слова в нужном падеже, то есть будет показана частотность именно указанной формы слова.

Оператор «!» ставится перед нужным словом.

Пример: !тур +на бали

Да, я комбинирую различные операторы.

Уже 2 755 запросов

А «туры» искали больше

Не забывайте про «умных» людей, которые пишут не «на», а «в» Бали

Яндекс сочтет это синонимом на поиске, но для составления СЯ и определения частотности это может быть полезно.

Это действительно очень важный оператор. Представьте, что вы ищете частотность по запросу «купить билет в Москву«, а без этого оператора увидите еще и частотность «купить билет в Москве«, хотя это совершенно разные запросы.

Оператор «кавычки»

В кавычки берется запрос чтобы не показывать вложенные запросы, а узнать какая частотность только у указанных слов. При этом если не использовать другие операторы, то там так же будут меняться слова местами, окончания и т. д..

Важно! Если у вас в запросе повторяющиеся слова (например два раза предлог «на»), то Яндекс просто посчитает количество слов и может туда впихнуть лишнее слово.

Оператор [квадратные скобки]

Этот оператор учитывает все словоформы, стоп-слова и порядок слов.

Оператор «вертикальная черта и скобки»

Этот оператор нужен для группировки запросов. Я его использую когда надо быстро просуммировать частотность по множеству НЧ запросов.

Оператор «минус»

Оператор «-» ставят на те слова, которые не надо учитывать. В Директе минус-слова ставятся когда надо поставить запрет на показ рекламы по определенным запросам.

Можно так же комбинировать с другими операторами.

Перекрестная минусовка — используется уже при настройках рекламы. Если ключевые запросы пересекаются и один запрос содержит в себе другой, то тоже добавятся минус-слова. В этом случае ключевые фразы перестают конкурировать при выборе объявления для показа

При работе с операторами учтите также некоторые отличия Гугл от Яндекса:

Читайте подробнее про операторы Гугла.

Заказать настройку рекламы

WordStat 5 Новые возможности

СТРАНИЦА СЛОВАРОВ
  • Новая опция предварительной обработки позволяет создавать собственный текст предварительная обработка EXE или DLL (пример стеммера английского портера и n-граммы трансформация включена).
  • Новый диалог мониторинга лемматизации позволяет просматривать замены, переопределение существующих путем создания пользовательских замен.
  • Правила устранения неоднозначности с логическими значениями (И, ИЛИ, НЕ) и близостью операторы (РЯДОМ, ПОСЛЕ, ДО) теперь могут быть добавлены к категоризации словари (нажмите на миниатюру, чтобы увидеть снимок экрана).
  • Настройка уровня «Как показано» позволяет настроить категоризацию уровень к тому, как отображается дерево словаря.
  • Возможность создавать неразрывные категории (отменяя уровень параметр).
  • Словари категорий теперь можно распечатать или экспортировать в XML.
  • Возможность объединения существующих словарей.
  • Улучшено контекстное меню для более быстрого редактирования словаря.
СТРАНИЦА ОПЦИИ
  • Новая опция позволяет включать наблюдения с отсутствующими значениями для независимых переменных (переопределить существующее исключение по списку).
  • Функция выбора переменной для взвешивания случаев.
  • Новый порог для удаления элементов, встречающихся более чем в указанном % случаев.
СТРАНИЦА ЧАСТОТ
  • Возможность создавать файлы норм частоты ключевых слов и сравнение существующих частот к ранее сохраненным файлам норм.
  • Полностью новый диалог поиска ключевых слов позволяет извлекать документы, абзацы или предложения с определенной пользователем комбинацией ключевых слов. Извлеченные текстовые сегменты могут быть дополнительно помечены с помощью QDA Miner. коды (нажмите на миниатюры ниже, чтобы увидеть снимки экрана).
  • Полная категоризация процесс теперь может быть сохранен на диске и применен к документам с использованием автономная служебная программа (WS Document Classifier) ​​или дополнительная DLL и программа командной строки.
  • Дополнительный цветной линии сетки.
  • Включенные элементы могут быть временно удалены из дальнейшего анализа.
  • Добавлен столбец TF*IDF (частота термина x обратная частота документа).
АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ ДОКУМЕНТОВ
  • Применение наивного байесовского метода и метода k-ближайших соседей по встречаемости, частоте, проценту слов и т. д.
  • Выбор признаков и взвешивание признаков.
  • Методы перекрестной проверки (исключение одного, n-кратность, разделение выборки).
  • Модуль пакетного эксперимента и диаграммы истории для оптимизации модели.
  • Классификация документов по отдельным текстам, спискам документов или база данных.
  • Модель классификации может храниться на диске и применяться к внешние документы с помощью отдельной служебной программы (WS Document Classifier) ​​или дополнительную DLL и программу командной строки,
  • Дополнительно цветные линии сетки.
  • Включенные элементы могут быть временно удалены из дальнейшего анализа.
СТРАНИЦА КОНТЕКСТНОГО КЛЮЧЕВОГО СЛОВА
  • Страница KWIC теперь может быть отсоединена и отображаться как непрерывная диалог.
СТРАНИЦА ИЗВЛЕЧЕНИЯ ФУНКЦИЙ
  • Страница поиска фраз перемещена на извлечение функций страница.
  • Новый поисковик неизвестных слов позволяет быстро находить орфографические ошибки слова, аббревиатуры, технические слова, имена собственные и либо заменить, игнорировать или назначать их словарю категоризации.
КЛАСТЕРНЫЙ АНАЛИЗ
  • Добавлены вероятностные версии Жаккара и Соренсена (или Дайса) коэффициенты.
  • Добавлена ​​кластеризация ключевых слов второго порядка (на основе схожести моделей совпадений, а не просто совпадений).
  • Возможность выбора одного кластера и извлечения связанных документов.
  • Новая опция для скрытия кластеров отдельных элементов в дендрограммах и многомерных масштабирование сюжетов.
PROXIMITY PLOT
  • Новая опция для извлечения документов или текстовых сегментов, содержащих два конкретных ключевых слова.
ДРУГОЕ
  • Мастер преобразования документов теперь может извлекать текст из PDF файлы.
  • Модели категоризации и правила классификации могут быть сохранены на диске.
  • линий «Привязка к полу» на 3D графиках (МДС и корреспонденция участок).
  • WS Document Classifier, небольшое автономное приложение для применения ранее сохраненные модели категоризации и классификации во внешние документы.
  • Отдельно продаваемые версии WordStat для DLL и командной строки для автономный контент-анализ и автоматическая классификация документов (пока недоступно).
  • Значительные улучшения скорости. В таблице ниже указана скорость сравнения между v4 и v5. Этот тест был выполнен на частоте 1,2 ГГц. Компьютер Пентиум 3.

ЗАДАНИЕ

ВЕРСИЯ
4,0

ВЕРСИЯ
5.0*

СКОРОСТЬ
УЛУЧШЕНИЕ

Частота слов в 11 314 сообщениях группы новостей (3 249 029 слов) 5м 52с 2м 59с x2,0
— с лемматизацией и стоп-листом 6м 45с 3м 11с х 2,1
— классифицированы с использованием Словаря регрессивных изображений (РИД) 10м 4с 2м 24с х4,2
— классифицировано с использованием лингвистического исследования и Количество слов (LIWC) 10 м 52 с 2м 52с х3,8

* Повышение скорости может отличаться на других компьютерах и в финальной версии выпуск v5. 0.

Новые возможности версии 4 можно посмотреть здесь.

WordStat в 2022 г. — обзоры, характеристики, цены, сравнение

Выберите первый продукт для сравнения

Категория Любая категорияПрограммное обеспечение для A/B-тестированияПрограммное обеспечение для A/B-тестированияБесплатное программное обеспечение для маркетинга на основе учетной записиБухгалтерское программное обеспечениеБухгалтерское программное обеспечение для малого и среднего бизнесаБухгалтерское программное обеспечениеБесплатноеБухгалтерское программное обеспечение с открытым исходным кодомПрограммное обеспечение для рекламной аналитикиПрограммное обеспечение для эффективных вычисленийПрограммное обеспечение для партнерского маркетингаПлатформы AIМедицинская визуализация на основе ИИ — визуализация грудиМедицинская визуализация на основе ИИ — GeneralСистема бронирования авиакомпанийAirline Software SuiteВсе включено Программное обеспечение для одного бизнесаВсе в одном Программное обеспечение CRMАналитическая платформаПрограммное обеспечение для анимацииПрограммное обеспечение для обнаружения аномалийПрограммное обеспечение для обнаружения аномалийБесплатноПлатформа управления APIПрограммное обеспечение для отслеживания кандидатовПрограммное обеспечение для отслеживания кандидатовБесплатное программное обеспечение для разработки приложенийПрограммное обеспечение для управления эффективностью приложенийПрограммное обеспечение для планирования назначенийПрограммное обеспечение для искусственных нейронных сетейПрограммное обеспечение для управления ассоциациямиB2B Digital PaymentsПрограммное обеспечение для резервного копированияПрограммное обеспечение для хлебопекарниПрограммное обеспечение для сбалансированной системы показателейПрограммное обеспечение для сбалансированной системы показателей с открытым исходным кодомПрограммное обеспечение для поведенческой аналитикиПлатформа ускорения BI BI O Pen Source FreeИнструменты BIПрограммное обеспечение для потоковой аналитики больших данныхАнализ больших данныхПрограммное обеспечение для приема больших данныхПлатформа BigdataПрограммное обеспечение для выставления счетов и выставления счетовПрограммное обеспечение для выставления счетов и выставления счетов бесплатноПлатформа для бизнес-аналитикиСлужбы деловой электронной почтыБесплатная бизнес-аналитикаБизнес-аналитика с открытым исходным кодомПрограммное обеспечение для бизнес-аналитикиПрограммное обеспечение для бизнес-аналитики для малого и среднего бизнесаСистемы бизнес-телефонииПрограммное обеспечение для управления бизнес-процессамиБесплатное программное обеспечение для управления бизнес-процессамиПриложение для отправки текстовых сообщенийПрограммное обеспечение CADПрограммное обеспечение САПР бесплатноПрограммное обеспечение для календаряКолл-центр Программное обеспечение для автоматизацииПрограммное обеспечение для отслеживания звонковПрограммное обеспечение для кампаний и управления потенциальными клиентамиCampus Recruiting PlatformПрограммное обеспечение для прогнозирования денежных потоковПлатформа интеграции каналовПрограммное обеспечение Chart BuilderПрограммное обеспечение Chart Builder с открытым исходным кодомChatbot PlatformПрограммное обеспечение для управления церковьюОблачное программное обеспечение для бизнес-аналитикиОблачное программное обеспечение для бизнес-аналитикиFreeCloud Management PlatformПрограммное обеспечение для когнитивных вычисленийCognitive Search & Insights EngineПрограммное обеспечение для совместной работыColumn-Orient Базы данных edПрограммное обеспечение для управления комиссионнымиПрограммное обеспечение для анализа конкурентовИнструменты мониторинга цен конкурентовПрограммное обеспечение для управления соответствием требованиямПрограммное обеспечение для совместного анализаПрограммное обеспечение для управления строительными проектамиПрограммное обеспечение для управления контактамиПрограммное обеспечение для управления контактами бесплатноПровайдеры сети доставки контентаПлатформы для контент-маркетингаПрограммное обеспечение для управления жизненным циклом контрактовПрограммное обеспечение для управления контрактами бесплатноПрограммное обеспечение для оптимизации коэффициента конверсииПрограммное обеспечение для оптимизации коэффициента конверсии Бесплатное программное обеспечение для управления персоналомCore HR Программное обеспечениеCPQ SoftwareCreative Management PlatformCRM ПроизводствоПрограммное обеспечение для маркетинга CRMCRM SaaSCRM Программное обеспечение для продажCRM Service SoftwareCRM SMB SoftwareCRM SoftwareCRM Software AccountantsCRM Software ConstructionCRM Software eCommerceCRM Software Financial AdvisersCRM Software FreeCRM Software FundraisingCRM Software GmailCRM Software HospitalityCRM Software Mid SizeCRM Software MobileCRM Software Некоммерческое программное обеспечениеCRM с открытым исходным кодомCRM Software PharmaceuticalCRM Software Public SectorCRM Software НедвижимостьСтартапы программного обеспечения CRM Программное обеспечение для туристических агентствПрограммное обеспечение для управления растениеводствомИндивидуальная упаковкаПрограммное обеспечение для аналитики клиентовПрограммное обеспечение для анализа оттока клиентов, обновления программного обеспеченияПлатформа данных клиентовПлатформа взаимодействия с клиентамиПрограммное обеспечение для управления взаимодействием с клиентамиПрограммное обеспечение для анализа отзывов клиентовПлатформа клиентской аналитикиПрограммное обеспечение успеха клиентовCustomer Upsell, Cross Sell SoftwareDashboard SoftwareDashboard Software FreeDashboard Software Open SourceПО для анализа данныхПО для анализа данных Бесплатное ПО для смешивания данныхПО для очистки данныхДанные Программное обеспечение для обнаруженияПлатформа для интеграции данныхПлатформа для подготовки данныхПрограммное обеспечение для восстановления данныхПлатформа для обработки и анализа данныхПрограммное обеспечение для безопасности данныхПрограммное обеспечение для виртуализации данныхПрограммное обеспечение для визуализации данныхПрограммное обеспечение для визуализации данныхБесплатноБаза данныхБаза данных как услугаМодель данных NoSQLБаза данных как услугаМодель данных SQLПрограммное обеспечение для интеллектуального анализа данныхПрограммное обеспечение для интеллектуального анализа данных бесплатноПрограммное обеспечение для глубокого обученияПрограммное обеспечение для проектированияПрограммное обеспечение для управления цифровыми активамиПлатформа цифровой коммерцииБесплатнаяDigital Commer Платформа ce с открытым исходным кодомПлатформы цифровой коммерцииПрограммное обеспечение для распределенного управления заказамиПрограммное обеспечение для генерации документовПрограммное обеспечение для управления документамиПровайдеры регистрации доменовПрограммное обеспечение для управления донорамиИнструменты рисованияИнструменты рисования бесплатноПрограммное обеспечение для прямой поставкиПрограммное обеспечение для электронной подписиПрограммное обеспечение для аналитики электронной коммерцииПлатформа для чат-ботов для электронной коммерцииИнструменты для электронной коммерцииПоисковая система для электронной торговлиИнструменты для электронной коммерцииПрограммное обеспечение EHSЦентр электронной почты и совместной работыПлатформа для анализа электронной почты Программное обеспечение для управленияEnterprise IT Management Suites SoftwareEnterprise Performance Management SoftwareИнструменты интеграции ERPSoftwareERP CloudERP Software ETOERP Software FreeERP Software LargeERP Software MTOERP Software Open SourceERP Software SMBERP UniversityETL SoftwareETL Software FreeEvent Management PlatformsEvent Management Software FreeEvent Management Software Open SourceExcel Busine Программное обеспечение ss Intelligence SoftwareПрограммное обеспечение для отчетов о расходахПрограммное обеспечение для создания отчетов бесплатноПлатформа Facebook Chatbot PlatformПрограммное обеспечение для управления фермойFashion ERP SoftwareПрограммное обеспечение для управления полевыми продажамиПрограммное обеспечение для управления полевыми услугамиПрограммное обеспечение для управления фиксированными активамиПрограммное обеспечение для управления автопаркомПрограммное обеспечение для флористовПрограммное обеспечение FlowchartПрограммное обеспечение Flowchart бесплатноПрограммное обеспечение для прогнозированияПрограммное обеспечение Form BuilderПрограммное обеспечение Form Builder бесплатноБесплатное антивирусное программное обеспечениеПрограммное обеспечение для учета фондаПрограммное обеспечение для сбора средствПрограммное обеспечение GamificationПрограммное обеспечение для диаграмм ГантаПрограммное обеспечение для диаграмм Ганта бесплатноПрограммное обеспечение для управления грантамиGoogle Aps Программное обеспечение FreeGraph Базы данныхПлатформа аналитики HadoopПрограммное обеспечение для интеграции и управления данными HadoopПрограммное обеспечение Hadoop Data LakeПрограммное обеспечение HadoopПлатформа Hadoop FreeHelpDeskSoftwareHelpDeskSoftFreeHelpDeskSoftware с открытым исходным кодомОблачное программное обеспечение для управления персоналомHR CountryHR Integration PlatformПрограммное обеспечение для управления эффективностью персоналаHR Service DeliverySoftwareHR SoftwareFreeHR Software Open SourceПО для управления персоналомSMBHRMSSoftwareIdea & Inno Программное обеспечение для управления идентификацией и управлением доступомПлатформа In Memory Data Grid PlatformПрограммное обеспечение для отраслевой бизнес-аналитикиInfluencer Management Platform и Influencer Marketing SoftwareInfographics MakerInfographics Maker FreeIntelligent Personal AssistantsIntelligent Process AutomationSoftware Management InventorySoftwareInvoicing & CreditPos SystemiPad POS SystemПрограммное обеспечение для отслеживания проблемIT Business Analytics PlatformПрограммное обеспечение Java Web FrameworkПрограммное обеспечение для управления ювелирным магазиномKPI Tracking Infrastructure Access Wired Программное обеспечение для целевых страницLead CaptureSoftwareLead IntelligenceSoftwareLead MiningSoftwareLearning ManagementSoftwareLearning ManagementSoftware Open SourceLeave ManagementSoftwareLeave Management SoftwareLeave Software Tools Бесплатные и с открытым исходным кодомИнструменты управления ссылкамиИнструменты LinkedinПрограммное обеспечение для живого чатаПрограммное обеспечение для живого чата бесплатноПрограммное обеспечение для потокового вещанияПрограммное обеспечение для управления домашним скотомПрограммное обеспечение для определения местоположенияПрограммное обеспечение для управления журналамиLogo Maker Software Fre Платформа разработки eLow-CodeПлатформа разработки Low-Code Бесплатная платформа разработки Low-Code с открытым исходным кодомПлатформы лояльности и рефераловПрограммное обеспечение для управления лояльностьюБиблиотека машинного обученияПрограммное обеспечение для управления обслуживаниемПрограммное обеспечение для производителей и дистрибьюторовПрограммное обеспечение для бизнес-аналитикиПрограммное обеспечение для картографической аналитикиПрограммное обеспечение для маркетинговой аналитикиПрограммное обеспечение для маркетинговой атрибуцииПрограммное обеспечение для автоматизации маркетингаПрограммное обеспечение для автоматизации маркетингаБесплатное программное обеспечение для автоматизации маркетингаПрограммное обеспечение для автоматизации маркетинга с открытым исходным кодомОблачная платформа для маркетингаПрограммное обеспечение для управления эффективностью маркетингаОсновные данные Программное обеспечение для управленияПрограммное обеспечение для управления медицинской практикойПрограммное обеспечение для управления членством бесплатноПрограммное обеспечение для управления членством с открытым исходным кодомПрограммное обеспечение для составления карт разумаПрограммное обеспечение для составления карт разума бесплатноПрограммное обеспечение для мобильной аналитикиПрограммное обеспечение для мобильного бизнес-анализаПлатформы для мобильной коммерцииПлатформа для мобильного маркетингаМобильные платежные провайдерыМультимодельные базы данныхМногоцелевые базы данныхПрограммное обеспечение для извлечения именованных сущностейПрограммное обеспечение для мониторинга сетиПрограммное обеспечение для мониторинга сетиБесплатноNewSQL DatabasesNoSQL DatabaseNoSQL Document Datab asesNoSQL Key Value DatabasesПрограммное обеспечение для заметок или приложенияОбъектные базы данныхПрограммное обеспечение OKRОнбординговое программное обеспечениеПрограммное обеспечение для управления онлайн-сообществомИнструменты для создания онлайн-курсовОнлайн-инструменты графического дизайнаОнлайн-платформа для группового принятия решенийПрограммное обеспечение для управления возможностямиПрограммное обеспечение для управления партнерамиПлатформа для партнерского маркетингаПрограммное обеспечение для менеджера паролейПрограммное обеспечение для управления исправлениямиПрограммное обеспечение для управления исправлениями БесплатноПрограммное обеспечение для расчета заработной платыПрограммное обеспечение для расчета заработной платыБесплатное программное обеспечениеPDFПрограммное обеспечение для личных финансовБесплатное программное обеспечение для личных финансовАнтивирусное программное обеспечение для личного пользованияПрограммное обеспечение для персонализации и ДвигателиПрограммное обеспечение PHP Web FrameworkПрограммное обеспечение PLMПрограммное обеспечение POS Бесплатное программное обеспечениеPOS Бесплатное программное обеспечение с открытым исходным кодомPoster and Flyer MakerБесплатное программное обеспечение для точного земледелияPredictive Analytics APIПрограммное обеспечение Predictive AnalyticsПрограммное обеспечение Predictive Analytics бесплатноПрограммное обеспечение Predictive Lead ScoringSoftware Predictive MaintenanceSoftware Prescriptive AnalyticsПрограммное обеспечение для презентацийПрограммное обеспечение для управления конфиденциальностьюPrivate Cloud PlatformsProcurement SoftwareProcurement Software Бесплатное программное обеспечение для управления продуктамиProduct Reviews PlatformsProductivity ApsПрограммное обеспечение для повышения производительностиПрограммное обеспечение для управления проектамиПрограммное обеспечение для управления проектамиБесплатноПрограммное обеспечение для управления проектами с открытым исходным кодомПрограммное обеспечение для управления портфелем проектов (PPM)Программное обеспечение для управления предложениямиПровайдеры публичных облачных вычисленийПрограммное обеспечение Python Web FrameworkПрограммное обеспечение для качественного анализа данныхПрограммное обеспечение для качественного анализа данныхБесплатноПрограммное обеспечение для проверки качестваПрограммное обеспечение для управления качествомПрограммное обеспечение для быстрой разработки приложенийRDBMS БесплатноПрограммное обеспечение Relationship IntelligenceПрограммное обеспечение для удаленного доступаПрограммное обеспечение для создания отчетовПрограммное обеспечение для отчетов Бесплатное программное обеспечение для создания отчетов с открытым исходным кодом, программное обеспечение для планирования ресурсов, программное обеспечение POS для ресторанов, программное обеспечение для розничной аналитики, программное обеспечение для управления ассортиментом в розничной торговле, программное обеспечение для управления розничной торговлей, POS-система для розничных магазинов, программное обеспечение для управления задачами в розничной торговле, платформа для управления доходами, программное обеспечение для управления рисками, роботизированная автоматизация процессов, программное обеспечение для аналитики продаж и отчетности по продажам, программное обеспечение для планирования продаж и операций (S&OP), программное обеспечение, обеспечивающее продажи. ent PlatformПрограммное обеспечение для автоматизации отдела продажПлатформа для анализа продажПрограммное обеспечение для управления эффективностью продажПрограммное обеспечение для управления продажамиПрограммное обеспечение для соблюдения налогового законодательстваРазработка приложений SalesforceПриложения SalesforceИнтеграция с электронной почтой SalesforceПриложения Salesforce ShippingПрограммное обеспечение для управления салонами и спаSearch Engine ServerSearch Engine Server FreeSearch Powered Analytics SoftwareSoftware Information Security and Event ManagementSoftware Self-Employed Accounting SoftwareSelf Service AnalyticsSoftware для подготовки данных самообслуживанияПрограммное обеспечение для анализа настроенийSEO SoftwareSmart Irrigation Программное обеспечениеПлатформа для социальной коммерцииПрограммное обеспечение для социальных сетей CRMПрограммное обеспечение для аналитики социальных сетейПрограммное обеспечение для аналитики социальных сетейБесплатноСоциальные сети InstagramПрограммное обеспечение для управления социальными сетямиПрограммное обеспечение для управления социальными сетямиБесплатноПрограммное обеспечение для маркетинга в социальных сетяхСоциальные сети PinterestСоциальные сети TwitterПрограммное обеспечение для социального мониторингаПрограммное обеспечение для социальных сетейПрограммное обеспечение для публикации в социальных сетяхБесплатноПО для SOPПрограммное обеспечение для бизнес-аналитикиSQLSQL Data Model Virtual Machine Deployment Fr База данных eeSQLSQL IDE Программное обеспечениеСтатистическое программное обеспечениеСтатистическое программное обеспечение бесплатноПрограммное обеспечение для статистического анализа текстаСтоковые фотосайтыПлатформы Stream Analytics с открытым исходным кодомSubscription Box BusinessSoftwareПрограммное обеспечение для управления подпискойЦифровое программное обеспечение для управления подпискойПрограммное обеспечение для аналитики цепочек поставокПрограммное обеспечение для управления цепочками поставокПрограммное обеспечение для анализа исследованийПрограммное обеспечение для опросовПрограммное обеспечение для экологической очисткиПрограммное обеспечение для очистки системыПрограммное обеспечение для управления талантамиПрограммное обеспечение для управления задачамиПрограммное обеспечение для управления задачами бесплатноПрограммное обеспечение для управления задачами с открытым исходным кодомПрограммное обеспечение для управления командойТекстовая аналитика APIПрограммное обеспечение для текстовой аналитики Программное обеспечение для текстовой аналитики FreeText Программное обеспечение для категоризацииTime Clock Software SystemsTime Clock Software Systems FreeПрограммное обеспечение для отслеживания времениПрограммное обеспечение для отслеживания времени БесплатноОблачное программное обеспечение TMSПрограммное обеспечение TMSПрограммное обеспечение Tour OperatorПрограммное обеспечение для управления продвижением торговлиПрограммное обеспечение для транзакционной электронной почтыПрограммное обеспечение для транзакционной электронной почты БесплатноUnified Modeling Language ToolsUnified Modeling Language Tools БесплатноUnified Security Manage Программное обеспечение для аналитики поведения пользователей и организацийУтилиты Информационные системы для клиентовПрограммное обеспечение для управления ветеринарной практикойПрограммное обеспечение для редактирования видеоПрограммное обеспечение для редактирования видео бесплатноПрограммное обеспечение для управления виноградникамиРазвертывание виртуальной машины Модель данных без SQLРазвертывание виртуальной машины Модель данных SQLСистема VoIPУслуги VPNСкладирование, логистика и выполнение поставщиков услугПрограммное обеспечение для управления отходамиПрограммное обеспечение для веб-аналитикиБесплатное программное обеспечение для веб-аналитикиБрандмауэр веб-приложенийВеб-конференции Программное обеспечениеСистемы управления веб-контентомПрограммное обеспечение веб-фреймворкаУслуги веб-хостингаУслуги веб-хостинга БесплатноПО для анализа веб-журналовШлюзы и процессоры веб-платежейИнструменты для парсинга веб-страницБесплатноИнструменты для парсинга веб-поискаПрограммное обеспечение для веб-семинаровПрограммное обеспечение для создания веб-сайтовПрограммное обеспечение для создания веб-сайтовБесплатноПрограммное обеспечение для управления WineryПрограммное обеспечениеWMПрограммное обеспечение для автоматизации рабочих процессовПрограммное обеспечение для автоматизации рабочих процессов БесплатноПрограммное обеспечение Workforce IntelligenceПрограммное обеспечение для управления персоналомПрограммное обеспечение для управления персоналом SMBWorkforce Optimiza Программное обеспечение Workspace ApsПрограммное обеспечение для управления дворомПровайдеры консалтинга по искусственному интеллектуMicrosoft Dynamics PartnersQlik Systems Integrators and ConsultantsSAP Ariba Consulting ServicesSAP Business ByDesign ConsultingSAP Business One ConsultingSAP BusinessObjects ConsultingSAP Hybris ConsultingSAP S/4 HANA ConsultingSAP SuccessFactors ConsultingTableau Alliance PartnersExecutive MBA ProgramsFinance Masters ProgramsFull Time Master ProgramsMBA Full Time 2 YearMBA YearMBA Полный рабочий деньПрограммы MS Data Science SchoolsМагистерские программы по управлению проектами в ИнтернетеМагистерские программы по управлению проектамиМагистерские программы по цепочке поставокМастерские программы по цепочке поставок онлайн

Товары

ЛИНГВИСТ Перечень 15.

1171: Программное обеспечение: Wordstat, версия 4

Далее следует обзор или заметка для обсуждения, внесенная в нашу Книгу. Дискуссионный форум. Мы ожидаем, что обсуждения будут неформальными и интерактивный; и автор обсуждаемой книги сердечно приглашается присоединиться.

Если вы заинтересованы в обсуждении книг, поищите книги объявлен на LINGUIST как «доступный для ознакомления». Тогда свяжитесь Шейла Дули Коллберг в Кольберг лингвистлист.org.

Данко Сипка, WordStat v. 4

Сообщение 1: WordStat v. 4

Дата: 10 апреля 2004 16:44:30 -0000
От: Данко Сипка
Тема: WordStat v. 4

WordStat v. 4, модуль анализа контента для SimStat , Исследования Провалис Данко Сипка, Институт критических языков, Университет штата Аризона WordStat v. 4, модуль анализа контента для SimStat от Normand P�ladeau of Provalis Research (http://www.simstat.com), принадлежит большое семейство программных пакетов, предназначенных для содержания анализ. Краткие сборники на: http://www.eval.org/EvaluationLinks/QDA.htm а также http://bama.ua.edu/~wevans/content/csoftware/software_menu.html со ссылками на конкурирующие программные пакеты предлагают возможность изучение опций пользователя в этом поле. В связи с ограничениями на длины, этот обзор будет рассматривать WordStat изолированно, без сравнивая его с другими доступными пакетами. Поскольку контент-анализ, наряду с другими отраслями прикладной лингвистика, часто подвергается маргинализации из-за работы в Английский как второй язык (ESL), определение подхода будет предоставляться. Согласно Нойендорфу (2002), контент-анализ — это систематический, объективный, количественный анализ сообщения характеристики.» Применение этого подхода в лингвистике очень широкий, начиная от криминалистической и разведывательной работы и заканчивая установление авторства. Более подробная информация о поле есть доступно на http://www.car.ua.edu/. Социологи и психологи традиционно работали в этой области, тем не менее, у лингвистов есть веская причина заниматься контент-анализ значительно шире и глубже, чем было дело в прошлом. Объяснения «систематические, объективные, количественные» от вышеупомянутое определение представляет собой стандарт каждого содержания пакет анализов должен соответствовать. Кроме того, такой анализ должен быть доступны для широкого круга исследований (с разнообразной информацией технологический фон, предмет, методология и язык интересы) и осуществляется в разумные сроки. «Легкий, но мощный инструменты для исследований и обучения», коммерческий слоган Provalis Research, фиксирует эти требования в элегантной лаконичной форме. WordStat — это модуль, а это значит, что его нужно запускать другое автономное приложение (в данном случае Simstat или QDA Miner). Поскольку использование одной из этих двух программ для запуска WordStat предусматривает несколько простых шагов, с точки зрения пользователя разница между модулем и приложением носит чисто академический характер. точка зрения потребителя совершенно иная, поскольку эта функция требует покупка комплекта. WordStat использует базу данных в качестве источника для анализа. Это легко импорт файлов в эту базу данных и адекватная поддержка преобразований из наиболее распространенных форматов (Excel, MS Access, SPSS и т. д.) при условии. Отсутствие поддержки Unicode (http://www.unicode.org) является серьезной проблемой. недостаток в этом сегменте программы. Хотя большинство текстов можно автоматически преобразованы из стандарта Unicode, все еще есть некоторые специализированные лингвистические тексты (например, любое использование самых разнообразных символы IPA, см. (http://www.arts.gla.ac.uk/IPA/ipa.html), которые требуют значительного поиска и замены, чтобы быть готовым к использованию в WordStat. Хотя в первую очередь предназначен для анализа с использованием схем кодирования на четких текстовых файлах программа поддерживает анализ вручную введенные коды (например, если исследователь помечает фрагмент текста как [ирония], [шутка] или любые другие прагматические или семантические теги). Как правило, как показано на выборочном наборе данных, включенном в программа, база данных содержит одну или несколько независимых переменных (обычно категории) и одна или несколько зависимых переменных (сообщение, текст и др. ). Таким образом, демонстрационные данные содержат два независимых переменные (пол и возраст) и одна зависимая переменная (тексты личных Объявления). После того, как переменные выбраны и WordStat инициирован, можно сдать серию анализов. Хотя многочисленные анализы могут быть выполнены без категоризации словарь, создание такого словаря является ключом к любому проницательному и значительные исследования. Примерный словарь категоризации сопровождающие вышеупомянутые данные образца личной рекламы могут быть использованы чтобы проиллюстрировать важность словаря категоризации. Словарь категорий, подготовленный для этого примера данных, содержит следующие категории верхнего уровня: внешний вид, искусство, общение, образование, семья, финансы, юмор, ночная жизнь, на открытом воздухе, сексуальность, духовность, спорт, работа. Каждая категория включает конкретные лексические Предметы. Категория внешности, например, содержит следующее лексемы: спортивный, привлекательный, красивый, красота, тело, бывший профессиональный спортсмен, красивый, мускулистый, телосложение, пропорциональный, стройный, стройный. Имея этот словарь, пользователь может выполнить анализ для всей категории. Таким образом, можно свести в таблицу частоты слов, связанных с появлением в рекламе размещены мужчинами и женщинами, можно создать соответствие для всех лексемы, относящиеся к внешнему виду и т. д. На более высоком уровне анализа может использовать всю категорию в качестве зависимой переменной. Например, если исследовательская гипотеза гласит, что мужчины больше подчеркивают внешность, чем женщин, пользователь может выбрать пол субъектов в качестве независимая переменная и категория внешности в качестве зависимой переменной и занесите в таблицу коэффициент корреляции Пирсона. Пример данные подтверждают гипотезу, обнаружив умеренно сильный статистически значимая корреляция между двумя переменными. Признание важности схем категоризации в содержании анализа, разработчик обеспечил отличную поддержку английского язык. Словарь для проверки орфографии и, в частности, стеммер (словарь лемматизации) значительно облегчают анализ. то же самое относится и к списку исключений (обычно он содержит синсемантические лексические единицы (предлоги, союзы и др.). Самый что немаловажно, есть несколько готовых категоризационных словарей. доступно на: http://www.simstat.com в первую очередь схемы, основанные на тезаурусе Роже и WordNet. лексическая база данных. В то время как на прежнем ресурсе полно функциональность, последняя несколько ограничена тем, что верхний уровень включает в себя части речи, а не категории контента и тем, что прилагательные и наречия артикулируются менее продуманная манера. Таким образом, если кого-то интересуют понятия, связанные с связи, вы получите два значения для существительных и глаголов соответственно, в то время как наречия и прилагательные будут исключены. Что за исследователь хотел бы получить результат всей категории с наречиями и прилагательные включены. WordNet (http://www.cogsci.princeton.edu/~wn) это превосходный лингвистический ресурс, который предлагает больше категорий возможности, чем используются в WordStat. С другой стороны, WordNet мастерски используется в модуле построения словаря. Из WordStat экран словаря, можно взять любой доступный словарь и спросить программа, используя кнопку «Предложить», чтобы оценить, какие новые слова должны быть добавлены в существующие категории. Расширенный режим ищет все возможные отношения в базе данных WordNet (синонимы, паронимы, гипернимы, координатные термины и т. д.) для новых слов или фраз и представляет эти слова в порядке убывания релевантности. Это позволяет быстрое создание всеобъемлющих и очень сложных словарей. Также доступны несколько дополнительных схем категоризации, включая словарь регрессивных изображений, лингвистический запрос и слово словарь count и словарь значений леса. Поддержка языков, отличных от английского, разнообразна и гораздо менее обильный. Средства проверки орфографии доступны для ряда языков (например, испанский, немецкий, русский, польский, венгерский и др.). Данные из эти средства проверки орфографии также можно использовать для определения словообразования кластеров и использовать их при разработке словарей категорий. стеммер доступен для французского языка в дополнение к английскому языку. Eсть бэкдор-решение для использования словаря категоризации для лемматизации лексемы иностранного языка, но этот метод требует лемматизации словарь для включения в схему категоризации. В кроме того, необходимо выполнить настройки для отображения незападных шрифтов. в настройках языка Windows, а не в приложении сам. Дополнительным недостатком для пользователей, заинтересованных в Контент-анализ языков, отличных от английского, заключается в том, что WordStat не хватает возможности Unicode. Хранение словарей категорий в отдельных текстовых файлах отличное решение. Это позволяет более продвинутым пользователям сохранять время подготовки за счет предоставления готовых текстовых файлов категоризации вместо того, чтобы использовать редактор словаря и вводить слова и категории. Другие пользователи, в свою очередь, адекватно поддерживаются словарем редактор и инструменты для сборки. Словари категорий являются гибкими в обеспечивая несколько иерархических уровней, они представлены в четкой формате, и они просты в использовании. Эта гибкость и простота принадлежит к четким сильным сторонам WordStat. После того, как схема категоризации создана и выбраны параметры, Есть четыре основных области анализа: Частоты, Перекрестная таблица, Key- Word-In-Context, поиск фраз. Последние два варианта хорошо известны к лингвистам. Поиск фраз можно использовать для идентификации n-грамм (сочетания двух или более словоформ), в то время как Key-Word-In-Context создает соответствие KWIC. Главный недостаток поисковика фраз заключается в том, что он предоставляет только глобальные частоты n-грамм и что в для того, чтобы разделить их по значениям независимых переменная (ы), нужно вернуться к согласованию для каждой n-граммы по отдельности или сохранить их во временном словаре категоризации. Конкорданс предлагает стандартные функции, которые можно найти в конкордансерах. (например, в Concordance, http://www.rjcw.freeserve.co.uk/) с дополнительная обработка связанных переменных. И поиск фраз, и concordancer остаются стабильными и занимают разумное время даже с относительно большими наборами данных. Область анализа под названием «Частоты» содержит таблицу частоты ключевых слов. численно и в процентах и ​​предоставляет возможность проведения кластерный анализ с использованием двух разных показателей и представлением их в в виде дендрограммы, 2D и 3D карт, графика приближения и таблицы. Все эти параметры работают без проблем, если набор данных ограничен. Большой наборы ключевых слов означают более длительное время обработки и более высокий объем памяти и ЦП требования к скорости. Самый полезный и разнообразный инструмент контент-анализа находится в область перекрестной таблицы. Этот параметр объединяет ключевые слова из схема категоризации с независимыми переменными. Диапазон доступны статистические процедуры (хи-квадрат, отношение правдоподобия, F Стьюдента, Tau-a/b/c, D/Dxy/Dyx Соммерса, Rho Гаммы Спирмена, R Пирсона и др.). В то время как имеющиеся статистические процедуры служат их функции хорошо, было бы полезно отметить статистически значимые значения вероятности, как это обычно делается в статистических пакеты (например, Statistica, http://www. statsoftinc.com/), например пометив p<0,01 двумя звездочками и p<0,05 одной. Отсутствие прямых доступ к Anova является препятствием для этого модуля. Чтобы проверить причинно-следственную связь связь между двумя переменными после статистически значимого подтверждена корреляция, необходимо отфильтровать и экспортировать данные и выполнить анализ в SimStat (т. е. в основном программном движке). Другие весьма полезные процедуры, такие как факторный анализ или метод Герфиндаля. Индекс концентрации Хиршмана в модуле не реализован. С другой стороны, кластеризация и корреспонденция статистики очень важны. сильная сторона этого статистического модуля. Различные меры и способы представление (дендрограммы, тепловые карты и таблицы) может вместить любое пользователя более чем адекватно. Еще одна сильная сторона WordStat — мощный механизм фильтрации регистров, который позволяет выбирать случаи в соответствии с выбранным логическим условием. Двигатель предоставляет широкий спектр функций и операторов, которые могут поддерживать даже самые сложные запросы фильтрации. Был проведен простой исследовательский проект, чтобы проверить функциональность WordStat для лингвистов. Было высказано предположение, что Русские словари девятнадцатого века демонстрируют более высокую степени дискурсивности, чем их двадцатый век аналоги. Нисходящий уровень дискурсивности идет вместе с профессионализацией и формализацией лексикографических приемов. К проверить гипотезу, буква А отрезков примерно одинакового размера из двух общих одноязычных словарей русского языка Даль (1866-1862) и Ожегов-Шведова (1992), были импортированы в базу данных с столетие словаря как независимая переменная (двадцатый век 0, девятнадцатый век 1), в то время как записи двух словари, представляющие зависимую переменную. Без русского доступный стеммер, самым простым способом измерения дискурсивности был использовать близкие флективные классы, такие как относительные местоимения и неизменяемые множества, такие как предлоги и союзы. Таким образом, эти слова включены в категорию категориальной схемы под названием Маркеры дискурсивности. Тогда коэффициент корреляции Пирсона был используется для проверки гипотезы. Результаты подтвердили гипотеза в том, что статистически значимая корреляция была находится между двумя переменными (столетие, когда словарь был опубликованные и маркеры дискурсивности). И этот тест, и общее прочтение модуля WordStat показывают, что это программное обеспечение соответствует своему корпоративному девизу. Это действительно легко но мощный исследовательский инструмент. Предложения по улучшению в последующие версии программного обеспечения включают поддержку Unicode, лучше поддержка языков, отличных от английского, реорганизация Словарь категорий на основе WordNet, включение дополнительных статистические процедуры и внедрение более эффективных алгоритмы для лучшей обработки больших наборов данных. В заключение, WordStat — отличный критерий для контент-анализа. очевидный потенциал стать, mutatis mutandis, правителем. ПОДТВЕРЖДЕНИЕ Рецензент выражает благодарность Дине Анани за корректуру этого текст.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *