Обзор сервиса JustMagic — Анализ текстов и многое другое
Последнее время все гуру SEO-индустрии в один голос кричат о необходимости работы над текстовыми факторами. Ссылочное теряет позиции (нет, не умирает, ибо бред), поведенческие крутить стрём, а вот работа с текстовыми факторами дело благородное и полезное.
Сегодня речь пойдёт о сервисе JustMagic, объединившем в себя множество инструментов, часть которых и призвана облегчить жизнь SEO-специалистам, а также позволяет «капнуть погублже» и получить максимум отдачи от текстов, которые мы размещаем на сайтах. Под отдачей я подразумеваю траф и позиции, естественно, сервис исключительно аналитический с соответствующим подходом. Иными словами — результаты работы с сервисом это сухие числа, которые выражают качество текстов и позволяют сделать текст максимально качественным с точки зрения SEO.
Маркетинговые трюки, речевые обороты, тавтологию, косноязычные изречения, литературный слог и прочий «гуманитарный изыск» данный сервис в расчет не берет.
Так что, если вы SEOшник и верите в силу текстовых факторов ранжирования — этот сервис, а соответственно и обзор части его функционала — для вас.
Начнем с небольшой предыстории. Автор программы — Алексей Чекушин, хорошо известный в профессиональных кругах SEO-специалист. Очевидно, что сперва ряд наработок сервиса использовался Алексеем для внутренних задач и лишь позднее перерос в открытый сервис. Just Magic позиционируется как сервис для опытных SEO-специалистов, а не широких масс.
Появился Just Magic лишь в прошлом году, однако за это время он сумел существенно подрости и обзавестись довольно богатым функционалом. Алексей активно развивает свой сервис и, я думаю, Just Magic спрятал еще не мало карт в рукаве.
Ну что, достаточно лирики — перейдем к обзору.
Возможности Just Magic
- Подбор семантики
- Расширение семантики
- Кластеризация запросов
- Оценка качества тематичности текстов «Акварель».
- Анализатор текстов
Функционал сервиса довольно широк, мы остановимся на каждом пункте и рассмотрим их в отдельности.
Удобство работы и внешний вид
Нет — это не прикол, сервис выглядит именно так. Первые минуты знакомства с Just Magic вызывали у меня щенячий восторг. Четко, модно, молодежно! Однако при более длительном контакте левый глаз начал подергиваться, пальцы отбивать чечетку по столу, а зубы скрежетать друг о друга… «Уау, как оригинально!» сменилось на «Да е…ы в …т, вы серьезно!? Где кнопка — нормальный интерфейс?». В общем, я искренне надеюсь, что Алексей услышит меня, и хотя бы в качестве сплит-теста попробует прикрутить к своему сервису более спокойный дизайн.
Удобство работы так же не порадует новичков, т.к. если вы не понимаете зачем это, не знаете злополучных регулярок и не в состоянии понять и применить, полученные результаты — то, вам не по пути.
Иными словами — к новичкам сервис не дружелюбен, и даже сам интерфейс намекает об этом, нарочито выкрикивая:»Школоло, когда все сидели под DOS-ом ты еще даже не ползал под столом!»
Сервис не очень интуитивен, но задавшись целью и покурив маны в течение 10-20 минут вам все покажется простым, понятным и разложенным по своим местам (это не умиляет того факта, что дизайн «вырвиглаз»).
Скриншот JustMagic
Раздел «Текстовый анализатор»
Вот, как в самом Just Magic описан раздел анализа текстов
В общем, на вход нам нужно подать Экселевский файл с расширением .xlsx, в котором будут содержаться URL наших посадочных и ключи напротив. Вот, как это выглядит на примере:
Лимит бесплатных проверок ограничен 5-ью страницами в месяц. Иными слвами на шару вы можете проверить 5 фраз по 10 ключам каждую.
Отчет/результат высылается на почту, указанную при регистрации и содержит 2 файла. Архив и .xlsx отчёт. В архиве файл с аналогичным содержимым, однако в формате .tsv
Открыв отчет в первый раз возникает ощущение, что структуру документа делали люди, при
Just-Magic — онлайн сервис для работы с ключевыми словами, семантикой
Обзор Just-Magic
Just-Magic — сервис, предназначенный для составления семантического ядра нового сайта, а также расширения семантики существующего ресурса. Генерация производится на основе собственных баз данных сервиса, популярных запросов поисковых систем и статистических данных портала. Бесплатный тариф включает в себя 100 лимитов в месяц.Инструмент подойдёт SEO-специалистам, поскольку позволяет группировать автоматически фразы при составлении структуры сайта. Платформой могут воспользоваться вебразработчики для создания нового ресурса. Доступны пакетные тарифы и расчёты за разовый анализ, что делает сервис удобным как для больших, так и маленьких компаний.
Для начала кластеризации необходимо залить список запросов — это можно сделать через окно браузера или загрузив таблицу в формате .XLS. Just-Magic анализирует слова и выводит результаты с рекомендованными рубриками и url’ами. При желании можно указать сайт-конкурент с желаемой структурой. Тематический классификатор определяет тематику страницы или фразы. Программа позволяет проверять тексты на наличие ключей и их видимость для поисковых роботов, а также находить лишние слова, которые могут способствовать пессимизации. Подключив инструмент к Яндекс.Метрике, можно получить данные о том, по каким запросам приходит аудитория сайта и какими фразами можно дополнить страницы для увеличения поискового трафика. Доступна проверка частотности ключей. Сгенерированный отчёт можно отправить по электронной почте.
Ключевые особенности
- Составление семантического ядра сайта
- Проверка текстов на наличие ключевых фраз
- Тематический классификатор
- Интеграция с Яндекс.Метрикой
- Бесплатно 100 лимитов после регистрации
JustMagic | Тематический классификатор — зачем он нужен, и как его правильно применять.
Что такое тематический классификатор?
Тематический классификатор — это еще один способ поменьше работать для оптимизатора. Попробуйте решить «простую» задачку. Вы напарсили запросы, и у вас получились вот такие:
- аквамарин
- аквамарин 2
- аквамарин 3
- аквамарин 4
- аквамарин 5
- аквамарин сочи
- аквамарин владивосток
- аквамарин казань
И вам нужно понять, что из них относится к вашей тематике, а что — лишнее. Допустим, ваша тематика — отели. Что вы будете делать? Скорее всего — зайдете в выдачу и посмотрите. Но так вы поступите, если запросов у вас десяток или два. А если их тысячи? Или — десятки тысяч? Метод «зайти и проверить каждый» работать перестаёт. И тут на помощь приходит тематический классификатор, который распределит эти запросы за вас. Вот как он справляется с представленным выше списком:

Как видим, отельной тематике соответствуют всего 3 запроса. «Аквамарин 3» — это бизнес-центр, «Аквамарин Владивосток» — это строящийся ЖК. А «аквамарин казань» — и вовсе ювелиры. Можете самостоятельно сходить в выдачу и проверить. Каким образом классификатор понимает, какой запрос к чему относится? Он делает то же самое, что и человек — идет в выдачу и смотрит что в ней есть. Затем сравнивает найденное в выдаче с некоторыми «эталонными» коллекциями. При этом анализируются не урлы сайтов или какая-то информация по ним, а сами текстов заголовков и сниппетов. В общем случае процесс выглядит так:
Запрос выдачи → Разбиение на слова → Построение вектора → Сравнение с векторами тематик.
Как это применимо на практике? Когда мы начинаем разбор какой-то новой ниши, или сбор семантики для сайта, мы всегда начинаем с массового парсинга запросов. Запросы мы эти получаем из вордстата, подсказок, вебмастера, метрики или баз. При любом методе сбора, мы всегда будем получать как соответствующие нашему сайту запросы, так и нет. Рассмотрим на достаточно хардокрном примере. Допустим, у нас есть автопортал, и мы хотим сделать раздел про BMW ALPINA. Мы обращаемся к вордстату, подавая к нему запросы alpina и альпина. И получаем вот такой интересный результат:

Оказывается, помимо BMW, alpina может быть чем угодно. Ботинками, отелем, даже пряжей. Посмотрим, как с такой задачей справится классификатор. Загружаем в него спарсенные запросы, фильтруем по вхождению «BMW» в тематике и получаем вот такой список:

Как видно, качество очень хорошее. Может показаться, что один запрос там лишний — а именно «вино альпина». Но если открыть выдачу и почитать, то станет понятно что нет, он очень даже к месту:
А в багажнике — еще один маленький штрих — вы найдете пристегнутый ремешками, деревянный ящичек. Внутри несколько бутылок вина. Компания Alpina всем клиентам обязательно дарит несколько бутылок с собственных виноградников. Вино — хобби хозяина фирмы Буркарта Бовенсайпена.
Если бы мы искали не «бмв», а что-то другое, то классификатор нам опять же помог бы. Например, мотоциклы:

Или автохимию:
(оказывается, альпина — это еще и бренд моторного масла).

Таким образом, в классический метод сбора семантики добавляется ещё один элемент. После первичного сбора ядра мы выполняем тематическую классификацию запросов и отсеиваем нетематичные:
Первичный сбор запросов → Тематическая классификация → Кластеризация/постраничное.
Ещё одно применение — это почистить текущее ядро. Причем классификатор справляется даже с теми случаями, где человек запрос оставит. Например, если мы продвигаем сайт про гостиницы, то казалось бы что криминального в запросе «гостиница чайка ярославль»? Однако, классификатор упрямо относит его в «/Бизнес/Недвижимость/Аналитика». Почему так происходит? Давайте заглянем в выдачу:

Оказывается, это недостроенная гостиница и для сайта бронирований отелей она совершенно не подходит. И такой пример далеко не единичный. Что может быть не так с запросом «давидыч гостиница самары»? А почему «отель двух миров уфа» лучше выкинуть из ядра? Ответы на эти вопросы можно получить только зайдя в выдачу. Или же — воспользовавшись классификатором.
Где пощупать тематический классификатор самому?
1) У нас есть шикарная полностью бесплатная демка классификатора: https://just-magic.org/serv/demo_temakl.php
Можно погонять отдельные запросы и посмотреть как классификатор справляется с вашей тематикой (работает только с запросами, урлы не разбирает).

2) Тематический классификатор встроен в кластеризатор: https://just-magic.org/serv/grp_onl.php
В столбце «tema» выводится результат классификации:

3) Тематический классификатор есть отдельным модулем: https://just-magic.org/serv/temakl.php
Зачем он нужен отдельным модулем, если уже встроен в кластеризатор?
1. Он дешевле. Ровно в 2 раза дешевле, чем кластеризация. Что очень актуально для чистки ядра перед кластеризацией или расширением.
2. У него есть опция выгрузки расширенных данных. Это очень актуально для запросов, которые могут быть отнесены сразу к нескольким категориям. Например, куда отнести запрос «диета для фитнеса»?
/Дом/Кулинария/Диеты?
/Дом/Мода и красота/Фитнес?
/Дом/Здоровье/Здоровый образ жизни?
Все три темы подходят для запроса. Расширенные данные выгружают не только 1, наиболее релевантную тему, а 10 релевантных с их условными весами, что упрощает работу с подобными запросами.
3. Он умеет работать не только с запросами, но и с урлами (этой опции нет и в демке). Допустим, вы хотите пробить своих/потенциальных доноров на тематичность. Просто загрузите список урлов (с http/https), анализатор сам распознает в них урлы и присвоит тематику:

Внимание! Анализатор определяет тематику не сайта, а конкретной страницы. Как пример — анализ трех разных категорий с Яндекс.Маркета:

Подведем итог. Тематический классификатор — очень удобный инструмент для массовой фильтрации запросов. Он может эффективно применяться как при фильтрации запросов при подборе ядра, так и для проверки текущего. Пользуйтесь классификатором, и ваши волосы будут мягкими и шелковистыми ядра станут лучше и чище.
JustMagic | Группы
Данные раздел служит для групповой работы над проектами, например, владелец веб-студии, может подключать к своей учетной записи произвольных пользователей.
Нормальную страницу с документацией всё руки не доходят сделать, поэтому краткая схема работы будет описана прямо тут.
Термины. Master — тот, кто управляет учёткой и подключает к себе пользователей. Slave — пользователь, который находясь в этом режиме, использует ресурсы учётки Master. Задачи, отправленные в этом режиме, принадлежат учётке Master и при ограничении доступа Masterом, Slave-юзер теряет к ним доступ.
Будучи одобренным Master(ом/ами), Slave юзер может переключатся между ними или своей учёткой в любой момент времени. Например, утром, придя на работу, оптимизатор подключается к Master-записи основной компании, а вечером, придя домой, выключает режим Slave и работает с личными проектами тратя ресурсы своей учётной записи.
Как происходит добавление Slave-юзеров:
- Slave-юзер должен зарегаться в системе и сообщить Masterу свой email. Пока пользователя нет в системе, Master не сможет его добавить.
- Master, убеждается, что у него активен режим Master, и добавляет Slave-юзера через форму, используя его email.
- Slave-юзер переключает основной режим системы в Slave.
- После выполнения предыдущего пункта, в нижней части страницы управления группами, у Slave-юзера появляется список тех Master, которые разрешили ему доступ. Их может быть несколько, т.к. одного юзера в теории могут добавить к себе несколько компаний. Slave-юзер должен выбрать из этого списка своего Master на текущий момент.
После этого, всё должно заработать. Если что-то не работает, то в разделе управления группами, и у Master, и у Slave выводится информация, кто в каком режиме находится и на каком основании. Если ничего не получается — пишем в саппорт. Кроме того, не забываем, что у Master должен быть тариф с поддержкой групповой работы.
JustMagic | Документация API
Оглавление
Введение
Если вы не обладаете достаточным опытом программирования и не понимаете принципов работы сетевых протоколов — просьба использовать веб-интерфейс и не трогать API. Система и документация сделаны на скорую руку и рассчитаны на более-менее опытных кодеров, которым не нужно разжёвывать элементарные вещи.
Вся архитектура серверов JustMagic построена по принципу KISS. Некоторые вещи, которые могут показаться нелогичными, неудобными или устаревшими, сделаны таким образом в угоду производительности и унификации. Например, 100млн строк, переданных в json формате, потребует относительно много памяти для распаковки. Если же эти строки передать в простом текстовом формате, разделив их символом перевода строки ‘\n’, то любой объем можно последовательно обработать с общим расходом памяти в несколько килобайт.
Любимые ОС, язык программирования и среда разработки архитектора системы — Linux, Си (без++) и Vim, а консоль bash — это воплощение удобства и красоты дизайна. Думаю, эти вкусовые предпочтения заранее ответят на возникающие вопросы вида «А почему всё так неудобно? А где готовая объектная библиотека под основные языки? Таки шо, всё нужно самим с использованием Curl писать?»
Общая информация
- Ключ доступа для API можно получить в личном кабинете.
- API доступно только для тарифов от Эцилоппа и выше.
- Система в стадии тестирования, при обнаружении багов, просьба проинформировать админа по адресу support@just-magic.org. За найденные баги отсыпаем чатлов.
- Настоятельно рекомендую подписаться на рассылку новостей API в личном кабинете, т.к. через неё будет происходить информирования об изменениях API.
- Описание выходных данных пока не описано в документации из-за нехватки времени и их очевидности. Если что-то совсем непонятно — спрашивайте в группе telegram, и эти данные будут немедленно описаны в документации.
- Пример кода, выполняющий простейшие операции можно скачать ТУТ. Рекомендую взять его за основу.
- Пример должен корректно работать на версиях PHP 5.5.0, PHP 7 и выше.
- Подразумевается консольный запуск командой ‘./api_ex.php‘, либо ‘/usr/bin/php api_ex.php‘
- В debian, для корректного консольного запуска нужен пакет php-cli. Ну и php-curl не помешает.
Базовые принципы:
- Все запросы отправляются на адрес https://api.just-magic.org/api_v1.php . Протокол строго https, http отвечать не будет.
- Данные отправляются в формате JSON в POST запросе. Кодировка UTF-8.
- Ответы возвращаются в формате json, за исключением случаев, когда был запрошен csv или xlsx файл результата.
- HTTP код ответа должен быть 200. Если это не так, значит что-то пошло не так.
- Все ответы имеют параметр err, который содержит короткий текстовый код ошибки и errtxt, который содержит подробное русское описание ошибки. При успешной работе err равно 0.
- Обязательные параметры модуля постановки задач отмечены красным цветом, все остальные параметры можно игнорировать, т.к. они заполнятся значениями по умолчанию.
- По некоторым простым параметрам, обработчика ошибок нет, при кривом значении оно будет автоматом заменено значением по умолчанию. Например, параметры search_engine или lang. Это сделано из-за нехватки времени. Чуть позже будет дописан нормальный обработчик ошибок, а пока просьба не ошибаться в параметрах.
- Особенности типа bool: Логическим false обладают следующие значения 0, ‘0’, », ‘false’. Всё остальное считается true. Лучше всего юзать 0 и 1.
- Для всех запросов должны быть обязательно переданы параметры action и apikey.
Ограничения системы:
Ограничения на число запросов: сервер не будет обслуживать больше 2 одновременных запросов с одного ip. Просьба отправлять задачи последовательно, а не параллельно. При кривом коде, который будет бессмысленно долбить сервер нон-стопом без пауз, доступ к API будет приостановлен. Интервал проверки готовности задач, просьба делать не меньше 30 секунд.
Типы запросов.
Тип запроса передаётся через параметр action. Допустимые значения info, put_task, get_task, list_tasks.
Тип info.
Выводит общую информацию об учётной записи, типа тарифа, стоимости операций, срок действия подписки итп. Дополнительных параметров не имеет.
Тип put_task.
Команда постановки задач. Все её параметры описаны в разделе модулей постановки задач. Подробное описание параметров можно смотреть на странице веб-интерфейса. Ядро обработки постановки задач у веб-морды и данного обработчика одно и то же. Красные параметры обязательные, всё остальное ставится по умолчанию если не передано.
Единственный дополнительный параметр, не описанный в таблицах и единый для всех модулей — это justask типа bool. При его установки в true, задача валидируется, считается её стоимость, но сама задача в работу не уходит и деньги не списываются. Этот модуль нужен для расчёта стоимости и валидации задач. Или для отладки.
Как и в веб-морде, так и в АПИ, система чистит входные данные. Удаляются все кривые непечатные символы, дубликаты строк итп. Предупреждений не выводится. Давным-давно, при первых стартах системы, мы не чистили входные данные сами, а выдавали предупреждения об ошибках и их месте. Люди были недовольны и просили просто всё фиксить автоматом и отправлять в работу. С тех пор так и повелось. ))
Описание выходных данных
- err — код ошибки, если 0, всё ок.
- errtxt — подробное описание ошибки
- tid — id поставленной задачи
- size — размер задачи в условных единицах. Для некоторых модулей это строки, для некоторых слова итп
- lim_price — цена одной единицы
- lim_plan — стоимость задачи
- lim_need — сколько не хватает денег. Если 0 — баланса достаточно
- just_ask — если true, то задача не отправлена, а только валидирована и рассчитана стоимость
Тип list_tasks
Выводит общий список задач пользователя, их статусы и дополнительные данные. Задачи сортируются в обратном порядке по убыванию. Т.е. первыми идут самые свежие.
Принимает необязательные параметры limit, по умолчанию равный 10, максимально 100 и offset по умолчанию 0. Эти параметры эквиваленты аналогичным в SQL запросах. Если вы не знаете, для чего они нужны, то пользуйтесь веб-интерфейсом. ))
Тип get_task
Служит для получения информации о конкретной задаче и выгрузке результата. Описание доп. параметров:
- tid — id задачи, с которой нужно работать
- mode — режим выдачи. Допустимо info, xlsx, csv. По умолчанию info.
- info — выдёт общие json данные о задаче, заголовки сервера:
- Content-Type: application/json;charset=utf-8
- xlsx — отдаёт результат в xlsx формате, заголовки сервера:
- Content-type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
- Content-disposition: attachment; filename=123_label.xlsx
- csv — выдёт данные в просто текстовом формате вида csv, html или txt, в зависимости от типа задачи. Выдаваемый файл сжат gzip. Заголовки сервера:
- Content-type: application/gzip
- Content-disposition: attachment; filename=123_label.csv.gz
- system — допустимо unix и win, по дефолту win. Имеет значение только для выдачи вида csv. При режиме unix выдаёт чистые данные с символом перевода строки «\n» в utf-8. Если режим выбран win, то перевод строки будет «\r\n», а в начале файла будет дописана BOM-метка юникодной кодировки.
Для режимов xlsx и csv используется не json, а бинарный формат данных, эквивалентный режиму сохранения файла в браузере.
Модули постановки задач
Модуль «Регулярки»
Тип задачи — rexp
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
rexp
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
base
int
Локальная база для выборки. Смотрим доступные базы в справочнике
3
rexpa
string
POSIX совместимое регулярное выражение по которому будет сделана выборка
кот\(ы\|ам\)
rexpd
string
POSIX совместимое регулярное выражение совпадения с которым будут ИСКЛЮЧЕНЫ из выборки
^злые\s
NULL
Модуль «Акварель»
Тип задачи — aqua
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
aqua
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
key
string
Ключевое слово, по которому будет проходить проверка
купить ноутбук
data
string
Проверяемый текст
В нашем магазине можно купить отличный ноутбук.
lang
string
Язык задачи. Возможные варианты — ru/en
ru
ru
Модуль «Акварель-генератор»
Тип задачи — aqua_gen
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
aqua_gen
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\nрозовый слон
lang
string
Язык задачи. Возможные варианты — ru/en
ru
ru
Модуль «Частотность WordStat»
Тип задачи — wsfreq
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
wsfreq
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
ya_lrws
int
Код региона по системе кодов Яндекса.
213
NULL
device
string
Тип устройства пользователя согласно справочной таблице.
desktop
all
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\nрозовый слон
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
s_std
bool
Собирать данные вида: (купить слона)
true
false
s_q
bool
Собирать данные вида: («купить слона»)
true
false
s_qv
bool
Собирать данные вида: («!купить !слона»)
true
false
s_qs
bool
Собирать данные вида: («[купить слона]»)
true
false
s_qvs
bool
Собирать данные вида: («[!купить !слона]»)
true
false
Модуль «Подсказки WordStat»
Тип задачи — wssug
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
wssug
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
ya_lrws
int
Код региона по системе кодов Яндекса.
213
NULL
device
string
Тип устройства пользователя согласно справочной таблице.
desktop
all
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\nрозовый слон
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
page
int
Число собираемых страниц вордстата. (увеличивает стоимость фразы) Допустимы целые числа от 1 до 40. При заказе 40 страниц, ценник равен 30 страницам. (скидка за объём)
40
1
Модуль «Текстовый анализатор»
Тип задачи — txt_anlz
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
txt_anlz
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
ya_lr
int
Код региона по системе кодов Яндекса.
213
213
f_type
bool
Соответствие по типу страниц
true
false
f_per
bool
Анализировать только пересечения
true
false
stop
string
Стоп-лист доменов. Список фраз, разделённых символом перевода строки «\n». Не более 10 доменов.
yandex.ru\nwikipedia.org\n
yandex.ru\nwikipedia.org\n
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n». Столбцы разделены символом «\t». Формат аналогичен формату xlsx файла.
url1\tкупить кота\n
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
Модуль «Тематический классификатор»
Тип задачи — temakl
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
temakl
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
f_gall
bool
Выводить 10 категорий и их условные веса.
true
false
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\n
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
Модуль «Маркеры-онлайн»
Тип задачи — mark_onl
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
mark_onl
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
ya_lr
int
Код региона по системе кодов Яндекса.
213
213
mode
string
Режим работы «hard» или «soft»
soft
hard
min_pwr
int
минимальный порог привязки. Допускается от 3 до 9.
3
3
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n». Столбцы разделены символом «\t». Формат аналогичен формату xlsx файла.
url1\tкупить кота\n
data_base
string
База для распределения. Список фраз, разделённых символом перевода строки «\n».
купить кота\nрозовый слон
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
file_b
file
Файл xlsx формата, альтернатива полю data_base. Максимум — 14мб. Если загружен файл, то поле data_base игнорируется.
Модуль «Маркеры»
Тип задачи — mark
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
mark
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
base
int
Локальная база для выборки. Смотрим доступные базы в справочнике
3
mode
string
Режим работы «hard» или «soft»
soft
hard
min_pwr
int
минимальный порог привязки. Допускается от 3 до 9.
3
3
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n». Столбцы разделены символом «\t». Формат аналогичен формату xlsx файла.
url1\tкупить кота\n
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
Модуль «Расширение семанитики»
Тип задачи — grp_deep
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
grp_deep
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
base
int
Локальная база для выборки. Смотрим доступные базы в справочнике
3
deep
int
Число итераций расширения. От 0 до 9.
2
1
min_pwr
int
минимальный порог привязки. Допускается от 3 до 9.
3
3
f_delsrc
bool
Удалить исходные ключи из финальной группировки
true
false
f_alter
bool
Альтернативный формат нумерации групп.
false
false
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\n
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
Модуль «Парсер подсказок»
Тип задачи — sug_par
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
sug_par
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
lang
string
Язык задачи. Возможные варианты — ru/en
ru
ru
ya_lr
int
Код региона по системе кодов Яндекса.
213
213
mode
string
Режим работы стандартный («std«), валидация («check«), отладка («debug«).
debug
std
iter
int
Число итераций. От 1 до 3.
2
1
f_porno
bool
Искать порно-подсказки.
false
false
f_rus
bool
Перебор русского алфавита.
false
false
f_eng
bool
Перебор английского алфавита
false
false
f_num
bool
Перебор цифр.
false
false
f_space
bool
Добавлять пробел к базовой фразе
false
true
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\n
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
Модуль «Кластеризация семантики.»
Тип задачи — grp_onl
Название параметра
Тип
Описание
Пример
По умолчанию
task
string
Тип задачи
grp_onl
label
string
Метка задачи, для удобства
для озона
NULL
f_mail
bool
Необходимость отправки email, после завершения задачи
true
false
search_engine
string
Движок ПС, допустимо yandex или google
yandex
yandex
lang
string
Язык задачи. ru или en
ru
ru
ya_lr
int
Код региона по системе кодов Яндекса для выдачи ПС!
213
213
ya_lrws
int
Код региона по системе кодов Яндекса для сбора частотности.
213
NULL
google_lr
string
Регион гугла. Копипастим со страницы кластеризатора английское название региона до табулятора целиком, как в примере. Если будет устойчивый спрос на гугл через АПИ — открою доступ к нашей структурированной базе регионов гугла, а пока так, ибо спрос низкий, а времени мало, есть более приоритетные задачи.
Saratov Oblast,Russia
Moscow,Moscow,Russia
device
string
Тип устройства пользователя согласно справочной таблице для сбора частотности.
desktop
all
data
string
Основная задача. Список фраз, разделённых символом перевода строки «\n».
купить кота\nрозовый слон
file_t
file
Файл xlsx формата, альтернатива полю data. Максимум — 14мб. Если загружен файл, то поле data игнорируется.
f_temakl
bool
Тематическая классификация запросов. Бесплатно, но требует сильно больше времени на выполнение задачи.
false
false
f_alter
bool
Альтернативный формат нумерации групп.
false
false
f_is_geo
bool
Определить ГЕО-зависимость запроса
false
false
f_is_comm
bool
Определение коммерческости запроса
false
false
s_std
bool
Собирать частотность вида: (купить слона)
true
false
s_q
bool
Собирать частотность вида: («купить слона»)
true
false
s_qv
bool
Собирать частотность вида: («!купить !слона»)
true
false
s_qs
bool
Собирать частотность вида: («[купить слона]»)
true
false
s_qvs
bool
Собирать частотность вида: («[!купить !слона]»)
true
false
domain
string
Домен для поиска релевнтных страниц
lib.ru
NULL
Особенности модуля:
- f_temakl может быть установлен только для языка ru, в остальных случаях он будет сброшен.
- f_is_geo и f_is_comm может быть установлен только для языка ru и ПС yandex, в остальных случаях он будет сброшен.
Справочники
Типы устройств пользователя
Id
Описание
all
Все типы устрйоств
desktop
Десктопы
tablet_phone
Мобильные (Планшеты и Телефоны)
tablet
Планшеты
phone
Телефоны
Базы данных ключей
Из-за низкой популярности локальных модулей, обновление базы для нас нерентабельно, поэтому, новые локальные базы собираться не будут.
Id
Год
Размер
Описание
3
2016
185 млн
Коммерческо-информационная база широкого спектра
История изменений
Тут будет публиковаться история изменений и обновлений API.
23.12.2018
Запуск первой версии API.



А в багажнике — еще один маленький штрих — вы найдете пристегнутый ремешками, деревянный ящичек. Внутри несколько бутылок вина. Компания Alpina всем клиентам обязательно дарит несколько бутылок с собственных виноградников. Вино — хобби хозяина фирмы Буркарта Бовенсайпена.







- Пример должен корректно работать на версиях PHP 5.5.0, PHP 7 и выше.
- Подразумевается консольный запуск командой ‘./api_ex.php‘, либо ‘/usr/bin/php api_ex.php‘
- В debian, для корректного консольного запуска нужен пакет php-cli. Ну и php-curl не помешает.
- info — выдёт общие json данные о задаче, заголовки сервера:
- Content-Type: application/json;charset=utf-8
- xlsx — отдаёт результат в xlsx формате, заголовки сервера:
- Content-type: application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
- Content-disposition: attachment; filename=123_label.xlsx
- csv — выдёт данные в просто текстовом формате вида csv, html или txt, в зависимости от типа задачи. Выдаваемый файл сжат gzip. Заголовки сервера:
- Content-type: application/gzip
- Content-disposition: attachment; filename=123_label.csv.gz
yandex.ru\nwikipedia.org\n