Как работает IndexNow от Яндекса: обзор нового инструмента
+7 (495) 128 22 58
Часто ищут
Новости SEO
Опубликовано 24 янв 2022г.
IndexNow — это небольшое обновление, которое Яндекс запустил в конце октября 2021 года. Инструмент даёт возможность одновременно отправлять на индексацию от 1 до 10 000 страниц.
SEO-аналитик Сергей Кокшаров решил проверить, как функционирует IndexNow. В ходе своего эксперимента он выполнил следующие действия:
- отправил запросы для различных страниц;
- проанализировал серверные логи;
- проанализировал результаты выдачи поисковика;
- сопоставил, как работает IndexNow и инструмент «Переобход страниц», доступный в Яндекс.Вебмастере.
Обход старых страниц
SEO-аналитик отправил 35 страниц на переобход. Спустя минуту он проверил логи. Было очевидно, что поисковая система проверила ключ. Однако в течение последующих 7 часов в логах не было никаких перемен.
Специалист отправил те же страницы в «Переобход», и в тот же момент робот их все обошёл. Соответственно, старый инструмент тут выигрывает.
Обход новых страниц
В этот раз на сканирование было отправлено почти 900 новых страниц, и роботы начали их сканировать сразу же. Из 887 страниц роботы проиндексировали 834 за 10 минут.
В IndexNow есть лимит на сканирование, то есть повторный запрос можно отправлять не ранее, чем спустя 10 минут. Вероятно, именно с этим связано количество проверенных страниц. То, что вы сможете отдать за 10 минут, и будет проверено роботом.
Если подключить к индексации «Переобход», то сканирование 100 новых страниц проходит в течение одной минуты. То есть можно сказать, что в случае с первичной индексацией оба инструмента примерно равны в своих возможностях.
Индексация страницы
При создании новой страницы и добавлении её в IndexNow Яндекс сканирует её сразу же. Однако в индексе она не появляется. Сергей повторил эксперимент дважды, но ни в первом, ни во втором случае никаких изменений в индексе не наблюдалось даже спустя 45 минут.
Тогда SEO-аналитик подключил «Переобход». Спустя 13 минут страница появилась в индексе, но была помечена «57 минут назад», то есть время соответствует времени добавления страницы в IndexNow.
Следующий эксперимент дал желаемый результат. Новая странице после добавления в IndexNow появилась в индексе через 24 минуты. Что, тем не менее, всё равно уступает в скорости «Переобходу».
Контрольный эксперимент дал более внушительный результат — страница была в индексе спустя 9 минут. Однако при этом была задана частота сканирования с интервалом в 2 минуты, но поисковик проверил страницу всего дважды.
Таким образом, по этому пункту пальма первенства снова достаётся «Переобходу».
Удаление из индекса
При удалении страница получает код статуса 404. Если отправить такую страницу на сканирование в IndexNow, то буквально ничего не происходит. Поисковик её не сканирует, из индекса она не удаляется. Это показал эксперимент Сергея. При отправлении этой же страницы в «Переобход» бот сканирует её сразу, а ещё через 50 минут она исчезает из индекса.
Вывод
IndexNow подходит для обхода новых УРЛ. Со старыми лучше не экспериментировать и подключать «Переобход». Отдавать страницы надо очень быстро, так как лимит в 10 минут существенно ограничивает возможности оперативной индексации.
Работу нового инструмента пока сложно назвать стабильной, возможно, в будущем разработчики его доработают. Если использовать конструкцию 301– 200 или 301– 404, то минусы IndexNow превратятся в плюсы.
Что ждёт SEO, маркетинг и e-commerce в 2022 году
Wildberries изменил формулу ранжирования товаров по популярности
Ваш браузер устарел рекомендуем обновить его до последней версии
или использовать другой более современный.
Автоматизация сбора данных статистики обхода и подачи на переобход страниц в Яндекс Вебмастере
Появление 404 статусов после обхода сайта яндексом вполне обычное дело, и таких страниц может быть достаточно много. При этом, нужно еще найти (определить) подходящую страницу для перенаправления (редиректа). Чтобы это не превращалось в сильную головную боль, мы нашли способ автоматизировать процесс. Предлагаем решение по упрощению той ситуации, когда мы ручками выбираем 404 страницы и пишем в .htaccess 301 редирект на актуальную страницу сайта, а затем отправляем несуществующую ссылку на переобход. Если таких ссылок 10, 20, 100 и более, то задача становится максимально рутинной — нужно взять ссылку несуществующей страницы, найти к ней максимально близкую (родственную) страницу, написать редирект и отправить на переобход.
И, именно этот процесс мы практически полностью автоматизировали.
Для получения битых ссылок достаточно скачать csv файл с результатами обхода, распарсить его и получить ссылки которые отдают 404 код.
Теперь, необходимо найти к этим несуществующим и битым ссылкам актуальные страницы или их ближайшую альтернативу, если такого товара (статьи и т. д.) больше не существует. Для этого можно использовать актуальную карту сайта sitemap.xml, но, если вы не уверены в её правильности, можно составить новый файл (во время составления карты сайта).
import sys
import logging
from pysitemap import crawler
if __name__ == '__main__':
if '--iocp' in sys.argv:
from asyncio import events, windows_events
sys.argv.remove('--iocp')
logging.info('using iocp')
el = windows_events.ProactorEventLoop()
events.set_event_loop(el)
root_url = 'ссылка/на/сайт'
crawler(root_url, out_file='file_input/sitemap.xml')
Как мы предлагаем все это автоматизировать
Визуально анализируем строение ссылки и делаем вывод о том, что общего в обеих ссылках – общее будет, как как минимум, каталог/раздел и, если, конечный товар/статья еще существует на сайте, то его название непременно содержится в обеих ссылках. Речь идет про ЧПУ в адресе ссылки, если вы не используете ЧПУ, то срочно переходите на них.
Установив такую закономерность, напрашивается простой вывод — для этой задачи отлично подойдет алгоритм Боейра-Мура (далее БМ) по поиску подстроки в строке.
def boyer_moore_match(text, pattern):
alphabet = set(text)
last = last_occurrence(pattern, alphabet)
m = len(pattern)
n = len(text)
i = m - 1 # text index
j = m - 1 # pattern index
while i
if text[i] == pattern[j]:
if j == 0:
return True
else:
i -= 1
j -= 1
else:
l = last(text[i])
i = i + m - min(j, 1 + l)
j = m - 1
return -1
Но, найти соответствия, это не еще не все, нам важно чтобы совпадали каталоги/разделы, так как название товаров по версии БМ могут быть одинаковыми, но содержаться в разных местах. Именно поэтому, когда скрипт по алгоритму БМ находит тождество, требуется проанализировать структуру ссылки и проверить ее на соответствие. И только после этого, можно смело заявлять о полном тождестве и записывать ссылки в файлик, где строки будут иметь вид:
Redirect 301 /каталог_икс/старая/ссылка/ https://домен.ru/каталог_икс/новая/ссылка
Для удобства, рекомендуем сортировать ссылки по каталогам и сохранять их файлом именно в таком виде.
При этом, нельзя забывать про остатки и одиночек, которым не нашлось пары — их мы записываем в отдельный файлик, который потом просматриваем с пристрастием и решаем, что с ними делать.
Теперь, берем все несуществующие и битые ссылки, которым нашлось соответствие и запишем их в отдельный файл, где разобьем их по 140 штук, т.к. именно такой дневной лимит на переобход дает Яндекс.
Таким образом, по итогу, мы получаем 3 выходных файла:
- файл с битыми ссылками, которым не нашлось соответствия
- файл со ссылками на переобход
- коллекцию файлов, отсортированных по каталогам с прописанными редиктами
Можно смело сказать, что получилось ускорить и автоматизировать работу более чем на 80%.
Все, что осталось сделать, это скопировать редиректы в .htaccess файл сайта и добавлять ссылки для переобхода в яндекс вебмастер.После добавления редиректов в .htaccess можем проверить, действительно ли невалидные ссылки дают 301 редирект на валидную страницу — для этого мы написали небольшую функцию:
import requests as re
def link_checker(links: list):
no_redirect = list()
for link in links:
r = re.get(link)
if str(r.history[0]) == "<Response [301]>":
continue
else:
no_redirect.append(link)
if no_redirect:
else:
return True
Дальше, об автоматизации
У Я. Вебмастера есть API, позволяющее отправлять ссылки на переобход.
1. Для этого нужно — создать приложение Яндекс.OAuth [https://oauth.yandex.ru/] и произвести авторизацию, о которой мы писали в статье интеграция с API соцсетей для авторизации пользователей.
2. Получаем идентификатор пользователя, необходимый для вызова любых ресурсов через API.
Запрос:
[GET] [https://api.webmaster.yandex.net/v4/user]
Ответ:
{
«user_id»: 1
}
где, user_id — это ID пользователя.
3. Далее, получаем ID сайта
Запрос:
[GET] [https://api.webmaster.yandex.net/v4/user/{user-id}/hosts]
где user_id — это ID пользователя из 2ого шага
Пример ответа:
{
«hosts»:
{
“host_id”:
“http:example.site:80”,
…
}
}
4. Следующим шагом, в теле запроса передаем URL страницы, которую следует переобойти.
[POST] [https://api.webmaster.yandex.net/v4/user/{user-id}/hosts/{host-id}/recrawl/queue]
где
user_id — ID пользователя полученный во 2ом шаге
host_id — ID сайта из шага 3
{
“url”: “http://вашсайт.рф”
}
где url — это ссылка на Ваш сайт
Ответ:
{
«task_id»: «c7fe80c0-36e3-11e6-8b2d-df96aa592c0a»,
«quota_remainder»:
1
}
где task_id — это ID задачи на переобход
quota_remainder — это остаток запросов(сайтов), которые вы
можете отправить на переобход в течение суток (Не забываем, что их максимальное количество 140)
Можно написать простой Task Manager, который будет заниматься отправкой ссылок на переобход, но, это по желанию. В результате, мы автоматизировали одну из самых рутинных задач по SEO. С подробным кодом можно ознакомится на нашей страничке гихаб [https://github.com/StudioDivier/seo-urls]
к списку статей
Как восстановить пароль почты яндекс без телефона
почтальон общий 0 комментариев
Содержание:
Предлагает огромное количество сервисов, которые являются частью «экосистемы» и выполняют различные задачи. Общее количество активных пользователей составляет несколько десятков миллионов человек. Это популярный сервис для обмена электронной почтой. Рассмотрим способы, как это сделать. В целом, есть несколько вариантов выполнения этой задачи.
Восстановление не всегда возможно. В этом случае следует подумать о создании нового профиля. Основная проблема заключается в необходимости использования мобильного номера для регистрации. Здесь вы можете посоветовать специализированный сервис «SMS-Man». Здесь доступны виртуальные номера для регистрации на Яндекс Почте от 7 центов. Их покупка осуществляется в несколько кликов, сообщения с кодом подтверждения приходят практически моментально.
Как восстановить аккаунт Яндекс с помощью дополнительной почты?
Сервис предлагает несколько вариантов восстановления доступа. Использование номера телефона является наиболее распространенным способом. Если он не привязан к учетной записи или недоступен, то есть альтернативные решения.
1. Сначала перейдите на страницу восстановления доступа. Нажимать на ссылку «Я забыл свой логин» стоит только при наличии Яндекс ID. В противном случае система предложит ввести номер телефона.
2. Затем выбрать способ восстановления пароля Яндекс Почты без телефона. Соответственно, выбираем пункт «Дополнительная электронная почта».
3. Последний шаг — открыть страницу, где нужно ввести дополнительную почту. Это адрес электронной почты, который был назначен в настройках. На него отправляется код восстановления.
К сожалению, не у всех в настройках указывается резервная почта. Это вызывает дополнительные сложности, решение которых будет рассмотрено в следующем разделе.
Как восстановить профиль Яндекс с секретным вопросом?После ввода логина или почты вам будет предложено не только отправить код подтверждения. Вы можете использовать опцию для ввода ответа на секретный вопрос. Указывается при регистрации или при дополнительных настройках аккаунта. Это удобный способ восстановить Яндекс Диск без телефона (действителен для всех сервисов этой экосистемы).
Отображается окно со следующим содержимым.
После правильного ответа вам будет предложено ввести новый пароль. Остается последний вариант, который мы и рассмотрим далее.
Как восстановить почту Яндекс без номера телефона через службу поддержки?
В этом случае необходимо обратиться в службу технической поддержки. Проще всего это сделать через форму восстановления, о которой шла речь ранее. Вам нужно нажать кнопку «Не удается восстановить». Нас перенесет на следующую страницу.
Нам будет предоставлена форма для связи со службой технической поддержки. Вы должны заполнить все пункты и нажать кнопку «Далее».
В результате в течение нескольких рабочих дней сотрудники обработают анкету и свяжутся с пользователем.
Сервис решения капчи Яндекс — Онлайн API распознавания и обхода капчи
Процесс решения обычной капчи выглядит следующим образом: мы берем изображение капчи со страницы и отправляем в сервис 2Captcha, где сотрудник решает ее, вводя указанную текст, то нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи
API demoКак решитьПроцесс решения текстовой капчи выглядит следующим образом: берем текстовый вопрос капчи со страницы ее размещения и передаем в сервис 2Captcha, где он решается сотрудником, после чего выдается ответ нам возвращается, которую необходимо ввести в соответствующее поле для решения капчи
API demoКак решитьПроцесс решения следующий: берем изображение капчи со страницы ее размещения и инструкцию на какие картинки кликать и передать ее в сервис 2Captcha, где ее решает сотрудник, после чего нам возвращается ответ в виде набора координат точек, на которые нам нужно нажать для решения капчи
API demoКак решитьПроцесс решения Rotate Captcha выглядит следующим образом: берем изображение или несколько изображений капчи со страницы ее размещения и передаем в сервис 2Captcha, где ее решает сотрудник, после чего выдается ответ возвращается нам в виде значения угла поворота изображения, нам нужно повернуть изображение на угол для решения капчи
API demoКак решитьПроцесс решения reCAPTCHA V2 выглядит следующим образом: параметры капчи берем из страницу в виде параметра data-sitekey и URL страницы и передать в сервис 2Captcha, где ее решает сотрудник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующий поле для решения капчи
API demoКак решитьПроцесс решения обратного вызова reCAPTCHA V2 не отличается от аналогичного процесса решения reCAPTCHA V2: мы берем параметры капчи со страницы в виде параметра data-sitekey и URL страницы и передаем на сервис 2Captcha, где ее решает сотрудник, то ответ возвращается нам в виде токена, который мы должны ввести в соответствующее поле для решения капчи. Иногда вы не найдете кнопку отправки формы. Вместо этого можно использовать функцию обратного вызова. Эта функция выполняется, когда капча распознана. Обычно функция обратного вызова определяется в параметре обратного вызова данных или в качестве параметра обратного вызова вызова метода grecaptcha.render
API demoКак решитьПроцесс решения reCAPTCHA V2 Invisible аналогичен распознаванию reCAPTCHA V2: берем параметры капчи со страницы в виде параметра data-sitekey и URL страницы и передаем в сервис 2Captcha , где ее решает сотрудник, после чего нам возвращается ответ в виде токена, который нам нужно ввести в соответствующее поле для решения капчи
API demoКак решитьПроцесс решения reCAPTCHA V3 выглядит следующим образом: берем параметры капчи со страницы в виде data-sitekey, action и URL страницы и передаем в сервис 2Captcha, где решается сотрудником с соответствующим рейтингом «гуманность», после чего идет ответ возвращается к нам в виде токена, который необходимо ввести в соответствующее поле для решения капчи.