Капча это что такое – API rucaptcha.com. Описание методов для пересылки изображений для распознавания и получение результата расшифровки. OCR API. Решение ReCaptcha

Капча — Википедия

Ка́пча[1] (от CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которая с лёгкостью решается человеком, но крайне сложна и трудоёмка для компьютера. По состоянию на 2013 год, каждый день пользователями по всей планете вводится примерно 320 миллионов «капчей»[2].

CAPTCHA — товарный знак университета Карнеги — Меллона, разработавшего данный тест.

smwm

Искаженная строка smwm

В наиболее распространённом варианте капчи пользователь вводит символы, изображённые на рисунке (зачастую с добавлением помех или полупрозрачности), но так, чтобы было очень затруднительно машинное распознавание текста. По общепринятым нормам доступности интернета для людей со слабым зрением, такая капча должна дополняться вариантом, основанным на распознавании речи (аудио-капча). Также есть капчи, где нужно выбрать правильную картинку из списка

[3].

Могут также применяться другие плохо алгоритмизуемые задачи: например, узнать, что находится на картинке, отметить все картинки с кошками, или ответить на вопрос, связанный со знаниями или менталитетом именно людей (например, загадка: «висит груша, нельзя скушать»). Тем не менее, стандартом стало именно распознавание символов: оно не привязано ни к какой культуре (основная помеха — слабое зрение), работает даже на мобильных браузерах, и пользователь со стажем быстро опознаёт картинку как капчу. Возможны также комбинированные капчи.

Недостатком капчи является то, что её не всегда можно разобрать. Из-за этого иногда приходится вводить капчу несколько раз.

Использование уязвимостей[править | править код]

Уязвимость в CAPTCHA

Предположим, картинка с цифрами 1234 вызывается кодом.

<img src="/captcha.php?code=1234" />

Вместо того, чтобы проходить капчу, машина считывает URL и вводит ответ 1234.

При недостаточной квалификации веб-программиста бот может выдать ответ, не проходя тест. Например, по какой-либо информации, содержащейся на странице, компьютер сам, без вмешательства человека, способен правильно ответить на вопрос, на который предположительно мог бы ответить только человек. Либо человек проходит тест один раз, а компьютер фабрикует множество запросов с тем же ответом.

Угадывание[править | править код]

Применяется в первую очередь для «нетрадиционных» капч с небольшим количеством вариантов ответа (1000 и меньше). Робот «гадает», посылая случайные ответы, и некоторые из них оказываются верными.

Использование баз данных[править | править код]

Данный подход эффективен, когда вопросы подготавливаются администратором, а не генерируются машиной. С помощью баз данных можно пройти многие нетрадиционные варианты капчи: например, отметить все картинки с кошками.

Автоматическое распознавание[править | править код]

Очень слабая капча (на примере phpBB) К верхнему изображению применяется отсечка по яркости (всё, что темнее некоторого порога, становится чёрным, остальное — белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужно даже оптическое распознавание символов, поскольку в ней есть сразу несколько слабых мест:
  • Лёгкость отделения символов от фона с помощью цветового ключа,
  • Лёгкость отделения символов друг от друга,
  • Фиксированный и неискажённый шрифт.

После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут распознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен.

В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки GD Graphics Library.

Существуют программы (например: PWNtcha), распознающие конкретные реализации капчи. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например: FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок капчи.

По отношению к автоматизированному распознаванию существуют понятия «слабая капча» и «сильная капча». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что сильная капча оказывается труднораспознаваемой и для человека, что уже есть неприемлемая крайность. Изредка встречается капча, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой), — такая капча вообще не соответствует назначению капчи как таковой.

Если сгенерированная картинка оказалась нечитаемой, пользователь, как правило, имеет возможность получить новую. Прочная капча должна выдавать картинку с другим ответом[4].

Многие нетрадиционные варианты капчи также на поверку оказались слабыми — «нероботоустойчивыми»[5][6].

Распознавание чужими руками[править | править код]

Есть способ «распознавания», использующий человеческий ресурс с высокопосещаемых сайтов. Робот скачивает капчу с нужного интернет-сервиса и предъявляет её посетителю сайта. Взамен посетитель сайта получает доступ к ресурсу, а робот узнаёт код, изображённый на картинке, и вводит его на «штурмуемом» сайте. Посетитель сайта может и не подозревать, что каждый просмотренный ролик оборачивается регистрацией нового почтового ящика для рассылки спама.

Для защиты (к сожалению, не полной) от такого способа обхода капчи сайт автоматически меняет капчу-картинку, если ответ на неё не ввели сразу (в течение небольшого промежутка времени), — регулярно каждый раз через определённый период времени, или при попытке начать запоздалый ввод ответа.

Есть также специализированные сайты для обмена или продажи капчи.

Капча сама по себе не может остановить спамеров. С другой стороны, этот метод защиты может создавать большие неудобства людям.

К тому же капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капчи и делает её ещё более неэффективной[7].

reCAPTCHA — проект, использующий в роли рабочего элемента для ответов пользователей на капча-запрос неразборчивое для OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг, в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки книжных текстов. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.

Капча — Википедия

Искаженная строка smwm

Ка́пча (от CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которая с лёгкостью решается человеком, но крайне сложна и трудоёмка для компьютера. По состоянию на 2013 год, каждый день пользователями по всей планете вводится примерно 320 миллионов «капчей»[1].

CAPTCHA — товарный знак университета Карнеги — Меллона, разработавшего данный тест.

Варианты реализации

В наиболее распространённом варианте капчи пользователь вводит символы, изображённые на рисунке (зачастую с добавлением помех или полупрозрачности), но так, чтобы было очень затруднительно машинное распознавание текста. По общепринятым нормам доступности интернета для людей со слабым зрением, такая капча должна дополняться вариантом, основанным на распознавании речи (аудио-капча). Также есть капчи, где нужно выбрать правильную картинку из списка

[2].

Могут также применяться другие плохо алгоритмизуемые задачи: например, узнать, что находится на картинке, отметить все картинки с кошками, или ответить на вопрос, связанный со знаниями или менталитетом именно людей (например, загадка: «висит груша, нельзя скушать»). Тем не менее, стандартом стало именно распознавание символов: оно не привязано ни к какой культуре (основная помеха — слабое зрение), работает даже на мобильных браузерах, и пользователь со стажем быстро опознаёт картинку как капчу. Возможны также комбинированные капчи.

Недостатки

Главным[источник не указан 1058 дней] недостатком капчи является то, что её не всегда можно разобрать. Из-за этого иногда приходится вводить капчу несколько раз.

Способы прохождения капчи роботом

Использование уязвимостей

Уязвимость в CAPTCHA

Предположим, картинка с цифрами 1234 вызывается кодом.

<img src="/captcha.php?code=1234" />

Вместо того, чтобы проходить капчу, машина считывает URL и вводит ответ 1234.

При недостаточной квалификации веб-программиста бот может выдать ответ, не проходя тест. Например, по какой-либо информации, содержащейся на странице, компьютер сам, без вмешательства человека, способен правильно ответить на вопрос, на который предположительно мог бы ответить только человек. Либо человек проходит тест один раз, а компьютер фабрикует множество запросов с тем же ответом.

Угадывание

Применяется в первую очередь для «нетрадиционных» капч с небольшим количеством вариантов ответа (1000 и меньше). Робот «гадает», посылая случайные ответы, и некоторые из них оказываются верными.

Использование баз данных

Данный подход эффективен, когда вопросы подготавливаются администратором, а не генерируются машиной. С помощью баз данных можно пройти многие нетрадиционные варианты капчи: например, отметить все картинки с кошками.

Автоматическое распознавание

Очень слабая капча (на примере phpBB) К верхнему изображению применяется отсечка по яркости (всё, что темнее некоторого порога, становится чёрным, остальное — белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужно даже оптическое распознавание символов, поскольку в ней есть сразу несколько слабых мест:
  • Лёгкость отделения символов от фона с помощью цветового ключа,
  • Лёгкость отделения символов друг от друга,
  • Фиксированный и неискажённый шрифт.

После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут распознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен.

В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки GD Graphics Library.

Существуют программы (например: PWNtcha), распознающие конкретные реализации капчи. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например: FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок капчи.

По отношению к автоматизированному распознаванию существуют понятия «слабая капча» и «сильная капча». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что сильная капча оказывается труднораспознаваемой и для человека, что уже есть неприемлемая крайность. Изредка встречается капча, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой), — такая капча вообще не соответствует назначению капчи как таковой.

Если сгенерированная картинка оказалась нечитаемой, пользователь, как правило, имеет возможность получить новую. Прочная капча должна выдавать картинку с другим ответом[3].

Многие нетрадиционные варианты капчи также на поверку оказались слабыми — «нероботоустойчивыми»[4][5].

Распознавание чужими руками

Есть способ «распознавания», использующий человеческий ресурс с высокопосещаемых сайтов. Робот скачивает капчу с нужного интернет-сервиса и предъявляет его посетителю сайта. Взамен посетитель сайта получает доступ к ресурсу, а робот узнаёт код, изображённый на картинке, и вводит его на «штурмуемом» сайте. Посетитель сайта может и не подозревать, что каждый просмотренный ролик оборачивается регистрацией нового почтового ящика для рассылки спама.

Для защиты (к сожалению, не полной) от такого способа обхода капчи сайт автоматически меняет капчу-картинку, если ответ на неё не ввели сразу (в течение небольшого промежутка времени), — регулярно каждый раз через определённый период времени, или при попытке начать запоздалый ввод ответа.

Есть также специализированные сайты для обмена или продажи капчи.

Полезность капчи против спама

Капча сама по себе не может остановить спамеров[источник не указан 1058 дней] . С другой стороны, этот метод защиты может создавать большие неудобства людям.

К тому же капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капчи и делает её ещё более неэффективной[6].

Известные CAPTCHA-службы

reCAPTCHA — проект, использующий в роли рабочего элемента для ответов пользователей на капча-запрос неразборчивое для OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг, в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки книжных текстов. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.

См. также

Примечания

Ссылки

Ответы@Mail.Ru: Что такое капча?

Так же, как все, «капча» , «капча» , Я по Сети хожу, хожу, И у нее, «капча» , «капча» , Файлов себе прошу… (Песенка про CAPTCHA) Пользователи Интернета часто сталкиваются с «капчой» . <img src=»//content.foto.my.mail.ru/mail/pans69/_animated/i-8024.gif» > CAPTCHA (от англ. Completely Automated Public Turing test to tell Computers and Humans Apart – полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей) – компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 г. Основная идея теста: предложить пользователю такую задачу, которую легко решает человек, но которую невозможно (или крайне трудно) решить компьютеру. Как правило, это задачи на распознавание зрительных образов. CAPTCHA чаще всего используется для предотвращения использования интернет-сервисов ботами, например, для предотвращения автоматической отправки сообщений, автоматической регистрации, автоматического скачивания файлов, автоматических массовых рассылок (спама) … <img src=»//content.foto.my.mail.ru/mail/pans69/_answers/i-8025.jpg» > В наиболее распространенном варианте CAPTCHA от пользователя требуется ввести символы, изображенные на предлагаемом рисунке в искаженном виде (с добавлением «шума» или полупрозрачности) . Реже применяются CAPTCHA, основанные на распознавании речи (как альтернатива для людей с нарушениями зрения) . <img src=»//content.foto.my.mail.ru/mail/pans69/_answers/i-8026.jpg» > Могут также применяться другие плохо алгоритмизуемые задачи, например: узнать, что находится на картинке, отметить все картинки с животными или ответить на вопрос, связанный со знаниями или менталитетом людей (например, «Сколько ног у курицы? » или «Как зовут российского президента?») . При недостаточной квалификации веб-программиста ботнет может пройти тест CAPTCHA, без распознавания изображенных символов и картинок. В этом случае бот либо подменяет идентификатор сессии, либо по какой-либо информации, содержащейся на веб-странице, определяет, что изображено на картинке. <img src=»//content.foto.my.mail.ru/mail/pans69/_animated/i-8027.gif» > Если количество вариантов ответов невелико, ботнет может попытаться угадать ответ. Боты используют несколько параллельно выполняющихся потоков, благодаря чему производительность бота зависит только от полосы пропускания, отданной ему в распоряжение. Если пользователь должен опознать картинку или ответить на вопрос, ботнет может попытаться каким-либо образом собрать базу данных всех имеющихся картинок (вопросов) . При недостаточной квалификации веб-программиста ботнет может пройти тест CAPTCHA, без распознавания изображенных символов и картинок. В этом случае бот либо подменяет идентификатор сессии, либо по какой-либо информации, содержащейся на веб-странице, определяет, что изображено на картинке. Если количество вариантов ответов невелико, ботнет может попытаться угадать ответ. Боты используют несколько параллельно выполняющихся потоков, благодаря чему производительность бота зависит только от полосы пропускания, отданной ему в распоряжение. Если пользователь должен опознать картинку или ответить на вопрос, ботнет может попытаться каким-либо образом собрать базу данных всех имеющихся картинок (вопросов) . Существуют программы, распознающие конкретные реализации CAPTCHA, к примеру, PWNtcha. Кроме того, существует возможность подключать модули программ распознавания текста (например, FineReader) в программы для распознавания «картинок» CAPTCHA. CAPTCHA различают по степени защиты: «сильная» CAPTCHA и «слабая» CAPTCHA. В числе «слабостей» – четкий фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона и т. д.

Набор букв и цифр, которые надо ввести человеку.

картинка с буквами или цифрами, которые нужно ввести для регистрации или других аутендификационных запросов

Защита от ботов, автоматических регистраций и т. д. путем ввода символов, которые типа может понять и прочитать только человек

Набор букв и цифр, которые надо ввести человеку

наборы букв или цифр

буквы или цифры

Ка́пча — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером

Это Говнищще полное

Ка́пча — компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. В Рунете устоялось название капча — фонетическая калька с термина

Граффити, для тренинга глаз, или тест на тупость, только умные в инете))))))

что это такое и зачем она нужна?

В тот момент, когда пользователь сети Интернет завершает процедуру регистрации или ему необходимо подтвердить свои действия на сайте, ему предлагается ввести символы с картинки, эта картинка и называется капча.

Зачем нужна капча?

Капча – это специальный код для подтверждения того, что Вы – человек, а не интернет-робот, защита от ботов.

Картинки с различным содержанием цифр и букв необходимы владельцам сайтов для того, чтобы отличить живого человека от робота. Роботы, то есть специальные автоматические программы, не умеют распознавать капчу. Владельцы интернет-сервисов опасаются роботов, так как последние могут изрядно навредить их сайту, и поэтому ставят защиту в виде капчи.

Теперь попробуем разобраться, чем так опасны роботы, что владельцы сайтов придумали такую защиту. После того, как создан новый сайт, его необходимо раскручивать и привлекать новых пользователей. Для этого его необходимо рекламировать, и давать на него ссылки во всевозможных блогах, форумах, в социальных сетях. Если это все будет делать человек, то это займет слишком много времени, умные люди придумали альтернативу такому методу. За небольшую сумму денег приобреталась регистрация на «нужных» сайтах и начинался откровенный спам. Владельцам заспамленных ресурсов не понравился такой поворот событий, и была придумана капча.

Но на введение капчи был придуман опять новый метод – создание специальных сервисов, на которых людям платят деньги за распознавание этих картинок в огромном количестве.

Как заработать на капче?

Чтобы заработать на распознавании картинок, вам необходимо зарегистрироваться на одном из сайтов: SociaLink или ruCaptcha. Далее ознакомиться с условиями работы, чтобы за нарушения не быть заблокированным, завести электронный кошелек и приступить к выполнению заданий.

Подробнее Вы можете узнать в статье «Заработок на вводе капчи».

Похожие статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *