Что такое рекапча: Как работает reCAPTCHA? / Хабр

Как работает reCAPTCHA? / Хабр

В обсуждении моего недавнего перевода замечательнейшей статьи про CAPTCHA несколько раз появлялись вопросы насчет reCAPTCHA, а именно как же эта система работает. Под катом я в общих чертах объясню суть reCAPTCHA, наглядно покажу как она работает и каким же образом она цифрует книжки.

Расскажу я все достаточно кратко, но зато понятно. Приведенные иллюстрации были взяты с официального сайта reCAPTCHA

Stop spam

По своей сущности, reCAPTCHA выполняет ту же функцию, которую выполняют другие капчи. Суть проста, вводим предложенный текст и тем самым доказываем, что мы не робот. Главным отличием от других систем является то, что reCAPTCHA не только защищает сайт от спамеров, но еще и выполняет другую, достаточно интересную функцию.

Read books

Как вы наверняка заметили, reCAPTCHA предлагает ввести два слова, что практически не встречается у других капч. Суть в том, что пользователь при вводе этих слов не только доказывает, что он человек, но еще и помогает распознавать старые книги и газеты.

Принцип работы прост:
Допустим, есть энная книга, которая сохранилась в малом количестве экземпляров, при этом все они в плохом состоянии. Один экземпляр в отсканированном виде попал в руки Google (владелец reCAPTCHA). Что с ним делать? Правильно, цифровать (и дело тут не только в сохранении наследия, но об этом позже). Как цифровать? Цифровать, используя системы распознавания символов (OCR). Но, как многим известно, эти системы очень часто грешат многочисленными ошибками в выданном результате. Вручную перебирать весь текст на предмет ошибок — слишком дорогое удовольствие. И вот, на помощь приходит reCAPTCHA. Одно слово в изображении распозналось системой OCR правильно, а вот второе никак нет. Второе слово — за пользователем, именно то, что он введет будет использовано в качестве замены ошибочному варианту, предложенным OCR. Наверняка сейчас некоторые усмехнутся, да, я знаю про то, что фактически вместо второго слова можно ввести что угодно.

Но каждое непонятное для OCR слово reCAPTCHA показывает пользователям сотни, а то и тысячи раз (при цифре в 200 миллионов генераций в день это очень мало), и в конечном итоге правильным считается тот вариант, который пользователи вводили чаще всего.

От скучного текста перейдем к иллюстрациям:

Вот так выглядит отсканированный текст. Качество, можно сказать, на высоте, но давайте же взглянем на результат работы OCR:

Красным выделены ошибки. Не правда ли их слишком много? А теперь посмотрим, что же будет результатом работы reCAPTCHA:

Не надо быть семи пядей во лбу, что бы увидеть разницу между OCR и дуэтом OCR + reCAPTCHA. Оцифровка получилась 100% безошибочной.

Разумеется, это что-то вроде идеальной ситуации, где все складывается так, как задумывалось создателями reCAPTCHA. Но наверняка многие из вас сталкивались с абсолютно нечитаемыми словами, предлагаемыми для ввода. Проблема в том, что некоторые книги \ газеты сохранились настолько плохо, что порой и вручную они распознаются отвратительно. Вот пример:

Изображение отвратительного качества. Посмотрим, что тут сможет сделать OCR…

… а ничего. Ошибки не подсвечены потому, что все это — одна большая ошибка.

Зато силами reCAPTCHA результат становится вполне себе читаемым, хоть и не безошибочным.

Именно таким образом пользователи помогают оцифровывать книжки средствами reCAPTCHA. По-моему, это прекрасно.

Я ничего не понял!

Вкратце: изображение, генерируемое reCAPTCHA, состоит из двух отсканированных слов. Одно уже заведомо известно системе, насчет второго же есть сомнения. Именно это второе слово и есть объект для распознавания силами пользователей. Грубо говоря, интерфейс reCAPTCHA мог бы выглядеть и вот так:

Скрипты для распознавания

Бытует ошибочное мнение, что reCAPTCHA невозможно взломать (речь идет об автоматическом распознавании приведенного текста, без участия человека).

Однако, судя по тенденциям, это не так. С течением времени reCAPTCHA понаделала различных подводных камней для систем распознавания. Среди них искривление текста, пересечение его полосами, так же недавно была введена фича, благодаря которой проверочное (известное системе) слово выглядит сдвоенным. Все это указывает на то, что reCAPTCHA все таки испытывает некоторые трудности с защитой.

Никто и не подозревал

Есть люди, которые критикуют reCAPTCHA, и с этической точки зрения, критикуют они не зря. Дело в том, что за распознанный текст Google так или иначе получает деньги. А сами тексты добываются вполне себе бесплатно, силами пользователей. То есть, тут имеет место бесплатный труд. Лично меня это не волнует, к тому же, никто не заставляет пользователей вводить reCAPTCHA, и более того, никто не заставляет веб-мастеров устанавливать ее на свои сайты 🙂

Ирония

Наверняка некоторые из вас, прочитав предыдущий абзац, поняли, что тут что-то не так. Все знают о сервисах по ручному распознаванию капчи, где миллионы азиатов вводят капчу за гроши. Итак, если принять во внимание предыдущий абзац, то получается, что эти азиаты работают не только на сервис по распознаванию, они работают и на Google. Бесплатно.

Captcha и reCaptcha: что это такое и чем они отличаются

Скорее всего, на сайте, когда вы хотите зарегистрироваться или собираетесь оставить комментарий, вы сталкиваетесь с Captcha или reCaptcha. Различия между ними реальны, хотя многие пользователи их не знают. Далее мы собираемся поговорить об этих терминах более конкретно, чтобы мы могли знать, что они собой представляют, в дополнение к различиям, которые мы находим между ними. Поскольку они со временем эволюционировали.

да мы можем говорят, что reCaptcha — это эволюция Captcha, который является оригинальным тестом, который стремился отделить людей от спам-ботов много лет назад, в начале 2000-х. Сначала мы расскажем вам о каждом из них, а затем подробнее об их отличиях.

Индекс

  • 1 Что такое капча
  • 2 Что такое reCaptcha
  • 3 Различия между Captcha и reCaptcha

Что такое капча

Начнем с этого термина. Captcha — это сокращение от Полностью автоматизированный общедоступный тест Тьюринга, позволяющий отличить компьютеры от людей. Это тест, который ищет различия в компьютерных людях. Это его основная цель, поэтому можно сказать, что мы сталкиваемся с обратным тестом Тьюринга. Потому что в этом случае люди должны доказать, что они действительно люди, а не машины.

Причина, по которой люди должны отличаться от машин в Интернете, что многим кажется странным, проста. В розыске предотвратить взаимодействие роботов или автоматизмов с веб-страницами. Таким образом, они гарантируют, что за каждым действием всегда стоит человек.

Captcha появилась в 2000 году после большого хаос из-за спама в конце 90-х. В данном случае была разработана система, позволяющая контролировать всю эту автоматическую рекламу. Пользователи были вынуждены регистрироваться на форумах и в электронных письмах. Поэтому им пришлось доказать, что они люди, а не программа или спам.

Так родилась капча. Вначале это был тест, в котором мы должны были распознавать некоторые буквы или цифры, которые было трудно читать в течение нескольких секунд. Простой процесс для людей, а не для ботов. Хотя и тут были проблемы. Поскольку он просил людей приложить усилия, просто чтобы показать, что они люди. По этой причине reCaptcha родилась как ответ.

Что такое reCaptcha

Таким образом, reCaptcha является эволюцией вышеупомянутого Captach с самого начала. Это система, которая стремится быть более продуктивной. С 2009 года эта система находится в руках Google., которые купили его, чтобы помочь им оцифровать свои книги в Google Книгах. Но они заставили его развиваться и использовать по-новому.

Поскольку reCaptcha в настоящее время позволяет подтвердите, что вы человек, нажав всего одну кнопку. Таким образом избегают кодов. То, чего Google добился с помощью серии алгоритмов и изучения неписаных подсказок для каждого пользователя. С этими параметрами алгоритм будет проверять поведение пользователя. Это позволит вам убедиться, что вы ориентируетесь как человек.

Кроме того,

записывает движение мыши, пока не будет нажата кнопка идентификация. Поэтому они всегда следят за тем, чтобы вам нужен был человек, чтобы бот не прошел этот тест. Короче говоря, замечательная эволюция в отношении Captcha.

Различия между Captcha и reCaptcha

В повседневной жизни оба типа в основном называются Captcha.. Это тот же термин, потому что оригинал был первым, кто использовался для этой технологии. Новая версия — это просто эволюция, поэтому нередко во всех случаях используется одно и то же имя. Хотя на самом деле существует несколько разных видов.

Итак, когда вы слушаете Captcha, они, вероятно, имеют в виду одну из разных версий Как дела. Хотя если в нем конкретно написано reCaptcha, то это относится к технологии, которую разрабатывает и использует Google. Последнее — это технология, которая развивается, и на самом деле уже есть новая версия, которая скоро будет реализована.


Содержание статьи соответствует нашим принципам редакционная этика. Чтобы сообщить об ошибке, нажмите здесь.

Вы можете быть заинтересованы

Что такое reCAPTCHA? Это бесплатно?

Что такое reCAPTCHA?

reCAPTCHA — это система проверки личности, предназначенная для борьбы со спамерами, которые пытаются использовать формы на веб-сайтах. Формы включают в себя контактные формы, поиск по сайту, формы регистрации подписки и т. д.

Процесс проверки reCAPTCHA работает, заставляя пользователей решать простые задачи, прежде чем разрешить доступ к формам. Цель этих тестов — определить, является ли пользователь человеком или «ботом».

Спамеры обычно используют ботов для случайного поиска веб-сайтов с помощью поиска Google или доступа к различным собранным спискам, распределенным между спамерами. Затем бот просматривает каждый веб-сайт, чтобы идентифицировать любые страницы, содержащие формы. Когда бот находит страницу с формами, он попытается заполнить данные в этой форме, используя специально написанный код и слова для выполнения вредоносных действий, таких как распространение вредоносных программ и фишинговые атаки через электронные письма, отправленные через формы.

Эти боты пытаются имитировать человека, посетителя вашего сайта, и reCAPTCHA представляет собой проблему, которую легко решить людям, но сложно для ботов и другого вредоносного программного обеспечения. Когда бот не может решить задачу на одной странице, он переходит на следующую страницу или другой веб-сайт. Эти проблемы делают reCAPTCHA эффективным инструментом защиты вашего сайта от спамеров.

Технология была первоначально разработана в Университете Карнеги-Меллона как CAPTCHA и является аббревиатурой от:

  • C полностью
  • A автоматизированный
  • P общедоступный
  • T тест, чтобы сообщить
  • Компьютеры C и
  • H люди
  • А часть

Он был приобретен Google в 2009 году и переименован в reCAPTCHA.

Является ли reCAPTCHA бесплатной?

На сегодняшний день Google предоставляет эту услугу бесплатно, а взамен получает возможность собирать аналитические данные с вашего сайта. Эти данные могут не иметь большого значения для вас, но для Google они, вероятно, стоят миллионы. Таким образом, это можно рассматривать как взаимовыгодное соглашение между вами и Google — Google бесплатно получает ваши личные данные, а вы можете бесплатно использовать reCAPTCHA.

Ранее в этом году Google сообщил, что собирается начать взимать плату за использование reCAPTCHA. Но прежде чем отказываться от reCAPTCHA или заменять ее, мы должны учитывать, что Google, скорее всего, будет следовать тому же процессу, что и с Google Maps, и предложит  бесплатный уровень.  Этого будет более чем достаточно для большинства небольших веб-сайтов, поскольку reCAPTCHA бесплатна для 1 000 вызовов API в секунду или 1 миллиона вызовов в месяц.

Что это значит для меня?

Если ваш сайт был создан сторонним разработчиком, вы больше не сможете использовать reCAPTCHA без активной учетной записи Google. Ваш разработчик, скорее всего, настроил API, используя свои собственные учетные данные Google, поскольку ему не нужно было активировать его с помощью кредитной карты.

При таком расположении ваша reCAPTCHA перестанет работать, если ваш разработчик не активирует ее с помощью кредитной карты, и в этом случае он будет нести любые расходы на использование вашего сайта. В будущем вы можете обратиться к своему разработчику и узнать, заинтересованы ли они в заключении с вами соглашения о выставлении счетов, чтобы вы могли продолжать использовать reCAPTCHA.

Кроме того, вы можете создать или использовать существующую учетную запись Google и активировать ее, отправив информацию о своей кредитной карте    в Google. В этом случае вам нужно будет создать и настроить новые детали API, чтобы восстановить reCAPTCHA. Для этого требуется настройка как в вашей учетной записи Google, так и на вашем веб-сайте.

Как уже упоминалось, бесплатный уровень в большинстве случаев не требует платы за небольшие веб-сайты с низким трафиком. Хотя меня не удивит, если в будущем Google изменит эту модель ценообразования и станет более агрессивной в своей структуре выставления счетов и уменьшит уровень бесплатного пользования, как мы видели с их API карт Google.

Легко для людей и сложно для ботов

Защитите свой веб-сайт, не вызывая трений у пользователей.

Капчи используются на многих веб-сайтах для защиты учетных записей пользователей от ботов и других автоматизированных программ, предотвращая их доступ к веб-сайту.

Согласно исследованию Imperva , вредоносные боты генерируют 25,6% всего веб-трафика в 2020 году. Они используются спамерами для рассылки автоматических сообщений пользователям, а хакеры — для атак на веб-сайты с помощью автоматических скриптов, которые часто наносят ущерб производительности сайта. .

Кроме того, хакеры могут удалить страницы, сообщения или украсть важную информацию о клиентах с вашего сайта.

Наиболее распространенные методы аутентификации:

  • 2FA — двухфакторная аутентификация
  • Сертификат SSL

Чтобы отличить реальных людей от ботов, Луис фон Ан, Дэвид Абрахам, Мануэль Блюм, Майкл Кроуфорд, Бен Маурер, Колин Макмиллен и Эдисон Тан из главного кампуса Университета Карнеги-Меллона в Питтсбурге разработали CAPTCHA , которая позже была приобретена Google.

Короче говоря, CAPTCHA означает:

Полностью автоматизированные общедоступные тесты Тьюринга, чтобы отличить компьютеры от людей.

Тест CAPTCHA может быть легко взломан роботами или хакерами, что послужило толчком к разработке reCAPTCHA.

Здесь мы углубимся в то, что такое reCAPTCHA и как ее можно реализовать на вашем сайте.

  1. Что такое reCAPTCHA?
  2. Как работает Google reCAPTCHA?
  3. Как установить reCAPTCHA на сайт?

Что такое reCAPTCHA?

reCAPTCHA — это бесплатная служба и автоматизированная система, которая помогает веб-сайтам защищать своих пользователей от спама и нежелательной почты. Его можно использовать для проверки того, что пользователи являются людьми, а не автоматизированными скриптами.

reCAPTCHA

Служба изначально была разработана Google в первую очередь для защиты поиска Google как способа предотвращения создания спам-комментариев.

Варианты использования
  1. Предотвращает мошеннические операции , такие как покупка товаров с помощью украденных кредитных карт.
  2. Запрещает распространение ложной информации и вредоносных ссылок .
  3. Прекращает атак грубой силы , в ходе которых хакеры неоднократно пытаются войти в систему, используя сотни разных паролей.
  4. Защищает вас от хакеров, которые регистрируются с нескольких учетных записей электронной почты, а затем используют их для незаконных целей .
  5. Не позволяет киберпреступникам публиковать сомнительных комментариев и упоминать другие веб-сайты в блогах или на новостных сайтах.
  6. Для повышения безопасности интернет-магазинов.

Является ли reCAPTCHA бесплатной?

Плата за первый миллион вызовов API в месяц не взимается. Корпоративные планы reCAPTCHA доступны для организаций, которые ежемесячно генерируют более 1 миллиона вызовов API.

Каждый вызов API до 10 миллионов в reCAPTCHA для предприятий стоит 1 доллар США, а для вызовов свыше 10 миллионов будет применяться специальная стоимость.

Как работает Google reCAPTCHA?

Во-первых, несколько веб-сайтов, в том числе IRCTC, используют традиционную Captcha , которая заставляет пользователей идентифицировать искаженные буквы и автоцифровые данные.

CAPTCHA

Чтобы пройти тест, поля формы должны быть заполнены правильным текстом после того, как люди интерпретируют искаженный текст. В этом методе буквы искажаются таким образом, что боты не могут их идентифицировать. Пользователям рекомендуется повторить попытку, если буквы не совпадают.

Боты, созданные с использованием искусственного интеллекта и машинного обучения, теперь могут распознавать искаженный текст и успешно проходить эти тесты с процентильной точностью 99,8%. Таким образом, вместо них reCAPTCHA заняла место и получила название «No CAPTCHA reCAPTCHA» .

Некоторые reCAPTCHA по-прежнему используют тот же метод с небольшой разницей в тексте. Тексты берутся из изображений реального мира, изображений улиц, печатных книг, старых газет и так далее.

Со временем Google обновил функциональность тестов reCAPTCHA, которые включают:

  • Распознавание изображений
  • Флажок
Image reCAPTCHA

В процессе проверки теста Image reCAPTCHA используются 9-16 реальных изображений с более низким разрешением в виде квадратов. Изображения могут быть как идентичными, так и разными.

Пользователям будет предложено выбрать изображение, например зебру, светофор, пожарный гидрант и т. д. После выбора полей с соответствующими изображениями пользователи должны пройти проверочный тест. По мнению Google, если ответ пользователя совпадает с ответом большинства других пользователей, то ответ считается правильным.

В этом тесте будут представлены изображения, которые мы, вероятно, видим ежедневно и которые могут быть легко идентифицированы людьми. Даже самым умным ИИ-ботам будет сложно выбирать объекты с низким разрешением.

Флажок reCAPTCHA

reCAPTCHA этого типа не требуют каких-либо тестов или распознавания чего-либо для их прохождения. Пользователь должен установить флажок с текстом «Я не робот» , чтобы пройти тест.

Поскольку ботам очень легко установить флажок, вы можете задаться вопросом, как это может быть способом обнаружения спамеров.

Флажок reCAPTCHA

Google автоматически фиксирует движение курсора пользователей, которые нажимают на флажок. Это действие не может быть смоделировано ботом, поскольку он щелкает флажок по прямой линии, поэтому он не проходит тест.

Зеленый значок флажка появится при щелчке флажка в ответ на движение курсора, сделанное пользователем. Кроме того, этот тест проверяет HTTP-куки и историю браузера пользователя.

Для слабовидящих пользователей этот тест также доступен в аудиоверсии. Пользователи услышат искаженный звук, что побудит их ввести правильный ответ в соответствующее поле.

Как установить reCAPTCHA на сайт?

Установку reCAPTCHA можно выполнить вручную или с помощью плагина WordPress. Вы должны выбрать тип и местоположение теста reCAPTCHA, который вы хотите использовать на своем сайте.

Тесты доступны четырех типов; вы можете выбрать один из них в зависимости от потребностей ваших пользователей и от того, какой тип даст им наилучший пользовательский опыт.

Ниже перечислены четыре различных типа reCAPTCHA:

  1. reCaptcha v3
  2. reCaptcha v2 — Флажок «Я не робот»
  3. Невидимая reCaptcha v2
  4. reCaptcha Android

В зависимости от ваших предпочтений, вы можете выбрать, где разместить сервис reCAPTCHA на своем сайте. Эта услуга обычно доступна через онлайн-формы, такие как регистрация, контакт и другие.

Перед установкой получите ключ API из панели администратора reCAPTCHA.

Заполните форму, чтобы получить ключ API reCAPTCHA.

Google reCAPTCHA
  1. Укажите название метки
  2. Выберите тип reCAPTCHA, который вы хотите использовать на своем сайте.
  3. Заполните домен. Также можно ввести более одного домена.
  4. В разделе «Владельцы» адрес электронной почты будет автоматически назначен вашей учетной записи Gmail, поскольку это инструмент Google. Кроме того, вы можете добавить один или несколько адресов электронной почты.
  5. Отправьте форму, нажав кнопку «Принять Условия использования reCAPTCHA» .

После отправки формы вам будет предоставлен API и секретный ключ. Используйте ключ API в форме HTML и секретный ключ для связи между вашим сайтом и reCAPTCHA.

Установка вручную

Установите reCAPTCHA вручную, добавив ее в файл PHP или HTML. Получите доступ к корневой папке вашего сайта и добавьте следующий код в заголовок ваших форм PHP в соответствии с вашими предпочтениями.

  

Скопируйте и вставьте приведенный ниже код перед строкой отправки.

 
Установка reCAPTCHA с помощью плагина WordPress

Плагины WordPress упрощают установку reCAPTCHA. В качестве первого шага вам необходимо определить плагин reCAPTCHA WordPress, который вы хотите установить на свой веб-сайт. На вашем сайте есть несколько замечательных плагинов для установки reCAPTCHA.

Следующие шаги помогут вам найти плагины WP:

  1. Войдите в свою панель управления WordPress.
  2. Перейдите в раздел Плагины.
  3. Используйте строку поиска, чтобы найти «reCAPTCHA» .

Плагин перечислит различные варианты, доступные в WordPress, что позволит вам выбрать тот, который соответствует вашим предпочтениям. Перед установкой убедитесь, что плагин совместим с вашей версией WordPress.

Плагины WordPress reCAPTCHA

Чтобы установить плагин reCAPTCHA WordPress:

  1. Нажмите «Установить сейчас» на выбранном плагине WordPress.
  2. Нажмите «Активировать плагин» , чтобы установить и включить плагин WP reCAPTCHA.

После установки плагина перейдите в место (например, контактная форма, форма регистрации), где вам нужно будет добавить службу reCAPTCHA на Dashboard .

Чтобы настроить интеграцию,

  1. Нажмите кнопку «Настройка интеграции» под reCAPTCHA
  2. Введите сгенерированный API и секретный ключ и, чтобы увидеть, были ли добавлены ключи, снова нажмите кнопку «Настройка интеграции» после нажав «Сохранить изменения» .

WordPress отобразит два ключа после завершения процесса интеграции.

Чтобы добавить reCAPTCHA в форму регистрации:

  1. Перейдите к Dashboard —> Контакт —> Добавить новый .
  2. Добавьте заголовок в разделе » Введите заголовок здесь » для каждой формы, чтобы различать их, если вы добавляете reCAPTCHA во многие формы.
  3. Добавить reCAPTCHA перед «[отправить «Отправить»]» строку в вашем коде и нажмите кнопку «СОХРАНИТЬ» .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *