Защита от роботов. Руководство разработчика
Авторами поисковых запросов могут быть не только пользователи, но и роботы. При большом потоке запросов от роботов могут быть превышены ограничения, наложенные на использование Яндекс.XML.
Для предотвращения несанкционированных обращений роботов к поиску используется алгоритм защиты. Если предполагается, что запрос задан роботом, вместо результатов поиска возвращается CAPTCHA (статья в Википедии про CAPTCHA).
Для использования алгоритма защиты от роботов партнер должен передавать сведения об IP-адресе и куке spravka автора запроса. Кука spravka формируется на стороне Яндекс.XML и возвращается при первом обращении пользователя за результатами поиска. В полученном значении партнер должен заменить домен на свой, а затем добавить следующую строку к поисковому ответу:
Set-Cookie: spravka=...
Сведения об IP-адресе и куке spravka передаются в заголовке запроса в формате:
X-Real-Ip: 99.999.999.99 Cookie: spravka=<значение, переданное от Яндекса>
Диаграмма последовательности действий, выполняемых для защиты от роботов, приведена на рисунке ниже.
Пользователь отправляет запрос партнеру Яндекс.XML.
Поисковый запрос отправляется сервису Яндекс.XML. Запрос должен соответствовать заданному формату.
Яндекс.XML инициирует выполнение алгоритмов защиты от роботов. Для проверки используются значения IP-адреса и куки spravka (если ранее выставлена).
Возможные результаты проверки:
Предположительно, запрос отправлен не роботом. Выполняется переход к пункту 13.
Предположительно, запрос отправлен роботом. Принимается решение об отображении CAPTCHA.
- Яндекс.XML возвращает партнеру XML-файл следующего формата:
<?xml version="1.0" encoding="utf-8"?> <yandexsearch version="1.0"> <response> <error code="100">Robot request</error> </response> <captcha-img-url>http://captcha.
image.gif</captcha-img-url> <captcha-key>Идентификационный номер CAPTCHA</captcha-key> <captcha-status>Статус</captcha-status> </yandexsearch>
Пользователю возвращается страница, содержащая CAPTCHA.
Пользователь отправляет значение CAPTCHA партнеру.
- Партнер отправляет полученное от пользователя значение CAPTCHA GET-запросом следующего формата:
https://yandex.ru/xcheckcaptcha?key=<идентификационный номер CAPTCHA>
&
rep=<введеное пользователем значение CAPTCHA> Полученное значение проверяется сервисом Яндекс.XML. Если введено некорректное значение CAPTCHA, выполняется переход к пункту 4. При этом в параметре
captcha-status
передается значение «failed».Если введено корректное значение CAPTCHA, Яндекс.XML выставляет пользователю куку spravka и передает ее партнеру в заголовке следующего формата:
HTTP/1.
1 200 OK Set-Cookie: spravka=
<
значение куки>
Если запрос, переданный в Яндекс.XML на шаге 1 был успешно сохранен, выполняется переход к шагу 12.
Партнер предлагает пользователю ввести запрос.
Пользователь отправляет запрос партнеру Яндекс.XML.
Поисковый запрос отправляется сервису Яндекс.XML. С запросом передается IP-адрес пользователя и кука spravka.
Яндекс.XML обрабатывает поисковый запрос и формирует результаты.
XML-файл с результатами поиска возвращается партнеру.
Партнер возвращает обработанный ответ пользователю. Если на шаге 9 Яндекс.XML выставил куку spravka, она сохраняется у пользователя.
Совет. Для ознакомления с реализацией приведенной схемы используйте данный скрипт.
Для ознакомления с форматом ответа, возвращаемого Яндекс.XML в случае отображения CAPTCHA, необходимо отправить в качестве запроса (значение параметра query
поискового запроса) следующую строку: «e48a2b93de1740f48f6de0d45dc4192a».
Следующий GET-запрос может быть использован пользователем «xml-search-user» для ознакомления с форматом ответа, возвращаемым в случае отображения CAPTCHA:
wget -q --header="X-Real-Ip: 127.0.0.1" -SO- 'https://yandex.ru/search/xml?user=xml-search-user&key=03.44583456:c876e1b098gh65khg834ggg1jk4ll9j8&query=e48a2b93de1740f48f6de0d45dc4192a&showmecaptcha=yes'
Обход Yandex SmartCaptcha с помощью API сервиса по решению капч 2Captcha
Процесс решения обычной капчи заключается в следующем: мы забираем изображение капчи со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи
API демонстрацияКак решитьПроцесс решения текстовой капчи заключается в следующем: мы забираем текстовый вопрос капчи со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ, который необходимо ввести в соответствующее поле для решения капчи
API демонстрацияКак решитьПроцесс решения заключается в следующем: мы забираем изображение капчи со страницы ее размещения и инструкцию, по каким картинкам необходимо кликать и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде набора координат точек на изображении, по которым необходимо кликнуть для решения капчи
API демонстрацияКак решитьПроцесс решения Rotate Captcha заключается в следующем: мы забираем изображение капчи со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде значения угла поворота изображения, на который необходимо повернуть изображение для решения капчи
API демонстрацияКак решитьПроцесс решения reCAPTCHA V2 заключается в следующем: мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey и адреса страницы размещения капчи и передаем их в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи
API демонстрацияКак решитьПроцесс решения reCAPTCHA V2 Callback не отличается от аналогичного процесса решения reCAPTCHA V2: мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey и адреса страницы размещения капчи и передаем их в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи. Иногда вы не найдете кнопки, отправляющей форму. Вместо нее может использоваться callback-функция. Эта функция выполняется, когда капча распознана. Обычно callback-функция определена в параметре data-callback или как параметр callback у функции grecaptcha.render
Процесс решения невидимой капчи reCAPTCHA V2 Invisible аналогичен распознаванию reCAPTCHA V2 и заключается в следующем: мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey и адреса страницы размещения капчи и передаем их в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи
API демонстрацияКак решитьПроцесс решения reCAPTCHA V3 следующий: мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey, параметра action и адреса страницы размещения капчи и передаем их в сервис 2Captcha, где ее решает работник с соответствующим рейтингом «человечности”, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи. Во многом новый вид капчи похож на reCAPTCHA V2, т.е. основной принцип остался тем же — пользователь получает от API 2Captcha токен, который отправляется в POST-запросе к сайту, а сайт верифицирует токен через API reCAPTCHA
Процесс решения reCAPTCHA Enterprise заключается в следующем: определяем тип reCAPTCHA, он может быть V2 или V3, после чего мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey и адреса страницы размещения капчи и передаем их в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи
Как решитьПроцесс решения KeyCaptcha заключается в следующем: мы забираем набор необходимых параметров со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде набора уже других параметров, который необходимо передать в соответствующие поля для решения капчи
API демонстрацияКак решитьПроцесс решения GeeTest Captcha заключается в следующем: мы забираем набор необходимых параметров со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде набора уже других параметров, который необходимо передать в соответствующие поля для решения капчи
API демонстрацияКак решитьПроцесс решения заключается в следующем: мы забираем параметры капчи, необходимые для ее решения в виде параметра data-sitekey и адреса страницы размещения капчи 2Captcha и передаем их в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи
API демонстрацияКак решитьПроцесс решения FunCaptcha Arkose Labs заключается в следующем: мы забираем набор необходимых параметров со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде набора уже других параметров, который необходимо передать в соответствующие поля для решения капчи
Как решитьПроцесс решения Capy Puzzle Captcha заключается в следующем: мы забираем набор необходимых параметров со страницы ее размещения и передаем в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде набора уже других параметров, который необходимо передать в соответствующие поля для решения капчи
Как решитьПроцесс обхода Lemin заключается в следующем: пользователь передает параметры капчи, необходимые для ее решения в сервис 2Captcha, где решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи.
Процесс решения капчи Cloudflare Turnsitle заключается в следующем: пользователь передает параметры капчи, необходимые для ее решения: «data-sitekey» и адрес страницы размещения капчи в сервис 2Captcha, где ее решает работник, после чего нам возвращается ответ в виде токена, который необходимо ввести в соответствующее поле для решения капчи.
API демонстрацияКак решитьПроцесс обхода аудио капчи полностью автоматизирован: в сервис распознавания нужно передать аудиофайл, который обрабатывается нейронной сетью, обученной распознаванию голоса. Результат распознавания возвращается в виде текста. Полученный текст можно использовать для обхода аудио капчи или перевода аудио в текст.
Как решитьПроцесс решения Arkose Labs Captcha является следующим: заказчик передает набор необходимых параметров со страницы ее размещения в сервис 2Captcha, где ее решает сотрудник, после чего возвращается ответ в виде набора уже других параметров, которые необходимо передать в соответствующие поля для решения капчи.
Процедура решения капчи Amazon AWS следующая: нужно передать набор необходимых параметров с целевой страницы и отправить в сервис, где работники сервиса решают капчу. Затем ответ возвращается в виде набора дополнительных параметров, которые необходимо ввести в поля для решения.
Как решитьБлокировка поиска и капча — Капча. Обратная связь
- Почему блокируется поиск?
- Как другие люди могут получить доступ в Интернет с моего IP-адреса?
- Как вернуться в поиск со страницы с капчей?
- Я не вижу капчи. Что я должен делать?
- Ошибка 403. Что делать?
- Связаться со службой поддержки
Поиск Яндекса может быть заблокирован, если с одного IP-адреса поступает несколько одновременных запросов. В этой ситуации трудно понять, являются ли поисковые запросы автоматическими или отправляются реальными людьми. Это может произойти, если несколько пользователей заходят на сервис Яндекса с устройств, подключенных к интернету, с одного IP-адреса. В таких случаях Яндекс интерпретирует их всех как одного пользователя и показывает капчу — тест на распознавание символов.
Пример капчи:
Запросы, полученные с вашего IP-адреса, не обязательно отправляются с вашего устройства. Интернет-провайдеры иногда выделяют один и тот же IP-адрес нескольким абонентам.
Если вы используете общедоступную сеть, например сеть Wi-Fi в кафе, то вы используете один и тот же IP-адрес со всеми другими людьми, использующими ту же точку доступа Wi-Fi.
Также возможно, что ваш компьютер заражен вирусом, который отправляет автоматические запросы. Мы рекомендуем запускать проверку на вирусы с помощью программы Dr.Web CureIt! программу или средство удаления вирусов от «Лаборатории Касперского».
Чтобы вернуться на страницу поиска, введите символы, показанные на изображении с картинки, и нажмите «Отправить».
Чтобы получить новое изображение с картинки, нажмите .
Вместо символов с картинки можно вводить цифры из аудио капчи. Для этого нажмите → Воспроизвести и прослушайте аудио.
Внимание. Яндекс только просит вас ввести символы с изображения и никогда не просит вас ввести номер телефона, отправить текстовое сообщение или повторно ввести имя пользователя и пароль. Если вас попросят сделать это, значит, вы зашли на поддельную страницу. Пожалуйста, сообщите нам об этом через форму обратной связи.
Если вы введете символы правильно, Яндекс надолго запомнит ваш браузер как надежный источник (при условии, что в вашем браузере включены файлы cookie).
Если вам нужно отправлять автоматические запросы в Яндекс, рассмотрите возможность использования сервиса Яндекс.XML.
Убедитесь, что в вашем браузере включена загрузка изображений.
Если вы видите логотип Яндекса, но не видите изображение с символами, убедитесь, что загрузка изображения не блокируется плагинами вашего браузера или настройками брандмауэра.
Если вы столкнулись с этой проблемой на работе, обратитесь к сетевому администратору.
Ошибка 403 означает, что доступ к сервисам Яндекса запрещен. Это происходит, когда автоматическая программа (бот) пытается обойти капчу и отправляет слишком много одновременных запросов с выделенных IP-адресов или через открытые прокси. Иногда боты могут использовать IP-адреса, принадлежащие реальным людям. В этом случае блокируется и доступ к сервисам.
Если вы столкнулись с этой ошибкой, воспользуйтесь формой обратной связи внизу страницы. Специалист рассмотрит вашу жалобу и разблокирует IP-адрес раньше, если запросы к сервисам не были автоматическими.
Вопрос по капче или ошибка 403Другие вопросы по сервису ЯндексаОбратитесь в службу поддержки этого сервиса напрямую. Для этого нужно зайти в соответствующую справку и воспользоваться там формой обратной связи (формы обычно расположены внизу страниц или доступны из оглавления). Так ваше сообщение сразу попадет к нужным специалистам и вы быстрее получите ответ.
Услуги, о которых часто спрашивают:
Если вам нужна помощь с Яндекс.
Деньгами, заполните форму на странице Службы поддержки.
Чтобы сообщить о проблеме с вашим сайтом, перейдите в раздел Обратная связь справки Яндекс.Вебмастера.
Яндекс Решатель SmartCaptcha — Обход Капчи
Яндекс Решатель SmartCaptcha — Обход КапчиНачать бесплатную пробную версию
- Авторизоваться
- Панель пользователя
- Связаться с отделом продаж
- Начать бесплатную пробную версию
- Быстрое и автоматизированное решение Yandex SmartCaptcha
- Очистить целевые сайты последовательно с автоматической ротацией IP-адресов
- Алгоритмы машинного обучения мгновенно решают капчу Яндекса
Время безотказной работы сети 99,99 %
Вероятность успеха 99,99 %
Высочайшее качество обслуживания и наилучшая масштабируемость
Лидер отрасли G2 2023
Награжден за лидерство в отрасли извлечения данных с точки зрения удовлетворенности клиентов, качества поддержки и присутствия на рынке
Лучшие инструменты для сбора данных 2022Награждены за лучшие на рынке инструменты для сбора любых общедоступных веб-данных
Лучшая экосистема прокси 2021
Награждены за лидерство в отрасли в области инноваций прокси и лучшее общее качество обслуживания клиентов
Как Web Unlocker оптимизирует путь вашего запроса
Никогда больше не блокируется
Web Unlocker автоматически разрабатывает новые методы, чтобы веб-сайты
всегда были открыты для сбора данных
Ограничение количества запросов на IP-адрес
Управление интенсивностью использования IP-адресов, чтобы вы не запрашивали подозрительный объем данных с какого-либо одного IP-адреса , & выполнение движений мыши
Имитирует нужные устройства
Web Unlocker эмулирует правильные устройства, которые серверы ожидают увидеть
Калибровка заголовка реферера
Убедиться, что целевой веб-сайт видит, что вы переходите на его страницу с популярного веб-сайта
Идентифицирует приманки
Приманки — это ссылки, которые сайты используют для раскрытия ваших поисковых роботов. Автоматически обнаруживать их и избегать их ловушек
Устанавливает интервалы между запросами
Автоматические задержки устанавливаются случайным образом между запросами
Почему клиенты предпочитают Bright Data
Решатель капчи Yandex
Непревзойденное качество обслуживания 901 46
Данные высочайшего качества
Наибольшее географическое покрытие
Лучшее время безотказной работы сети
Самый быстрый результат
Лучшая производительность
Самый высокий показатель успеха
в отрасли
Непрерывные инновации
Новые версии функций
каждый день 900 17
Самый надежный
Корпоративный уровень
Масштабирование
Попрощайтесь с капчей Яндекса!
Начать бесплатную пробную версиюКак работает Яндекс Решатель Капчи?
Web Unlocker от Bright Data использует CAPTCHA Solver для определения правил для популярных сайтов и их решения.