Что такое капча, как она работает?
При входе на веб-сайт в Интернете или при вводе конфиденциальной информации вас иногда могут попросить установить флажок, сопоставить изображения или ввести случайную последовательность цифр и букв.
Это известно как капча. Это разработано, чтобы остановить нечеловеческое поведение онлайн. Но что это на самом деле означает? И может ли CAPTCHA с одним простым шагом, помеченным галочкой, действительно остановить ботов от выполнения действий в Интернете?
Давайте глубже рассмотрим, что такое CAPTCHA и как она используется для обеспечения безопасности во всем Интернете.
Что такое капча?
Итак, по сути, CAPTCHA, как мы ее называем, представляет собой автоматизированный тест для определения, является ли пользователь человеком или ботом. Бот может быть автоматизированным программным обеспечением, предназначенным для размещения спам-комментариев в Интернете, страницами входа в систему подбора паролей с паролями или, возможно, программным обеспечением, которое пытается автоматически собирать информацию с других веб-сайтов. Используя CAPTCHA, боты могут быть остановлены от выполнения автоматического поведения, подобного этому.
CAPTCHA действительно может быть чем угодно, при условии, что она может использовать какой-то тест, который может быть пройден только при размышлении, как человек. В прошлом наиболее распространенным типом CAPTCHA был набор перемешанных букв и цифр, которые пользователи вводили для прохождения теста.
Буквы были нарисованы практически неподходящим шрифтом, что затрудняло его чтение любым подбор по типу автоматизированного программного обеспечения. Это работало, но с ростом возможностей ИИ безопасность, которую он предлагал, была сомнительной с годами.
В наши дни самая распространенная CAPTCHA, которую вы видите в Интернете, — это Google, которая называется reCAPTCHA. Есть альтернативы, но мы можем использовать Google в качестве объяснения того, как все это работает.
Типы ReCAPTCHA и как они работают?
Google прошла через три основных варианта программного обеспечения reCAPTCHA. Давайте посмотрим, как каждая версия отличается друг от друга и как они работают, чтобы остановить ботов.
reCAPTCHA v1 — традиционный текстовый тест
Оригинальная версия reCAPTCHA v1 может показаться вам ностальгической, и это потому, что она больше не используется по уважительной причине. Этот метод потребует от пользователей вводить слова, читая и переписывая то, что они видели на экране. Текст всегда был труден для чтения, чтобы предотвратить его взлом ботом.
В конечном счете, этот уровень CAPTCHA не обеспечивал длительную защиту, и с такой расстраивающей системой он раздражал пользователей и терял трафик многих владельцев сайтов
По мере того, как мы вступали в эпоху мобильности и ослабления внимания, Google захотел создать лучшее решение, и, таким образом, reCAPTCHA v1 был отменен, а v2 родился.
reCAPTCHA v2 — флажок «Я не робот»
reCAPTCHA v2 был огромным шагом в правильном направлении. С reCAPTCHA v2 программное обеспечение Google будет учитывать ваши нажатия клавиш и то, как движется ваша мышь, чтобы определить, робот вы или нет.
С каждым взаимодействием на веб-сайте с reCAPTCHA v2 программное обеспечение будет узнавать больше о том, что такое поведение человека, а что нет, делая его более точным по мере изучения. Если ваше поведение похоже на человека, вы просто нажмете на кнопку-флажок.
Если вы отмечены как подозрительные, вам будет предложено щелкнуть соответствующие фотографии на фотографии. Это тест, который дает конечному пользователю всего 55 секунд для решения. Для бота это может показаться сложным, и Google, похоже, поддерживает защиту сайтов от ботов. Тем не менее, поиск в Google покажет все виды исследований, тестов и программного обеспечения, которые утверждают, что они взломали систему с помощью бота.
Таким образом, reCAPTCHA v2 остановит ботов, замедлит ботов, возможно, до такой степени, что не стоит пытаться, но это не всегда может остановить мотивированного человека или организацию.
reCAPTCHA v3 — скрытая капча
reCAPTCHA 3
Владелец веб-сайта может затем настроить reCAPTCHA v3, чтобы заблокировать или запретить доступ пользователя в зависимости от уровня его оценки. В качестве альтернативы, ее можно настроить так, чтобы действия были ограничены или ограничены в течение короткого времени, сообщения отправлялись в очереди модерирования или требовалась вторичная аутентификация.
Еще раз проводятся исследования, чтобы попытаться взломать reCAPTCHA v3. На этот раз, однако, исследователи стремятся создать ИИ, который может посещать веб-страницу и выполнять там как можно больше человеческих действий, чтобы пройти невидимые тесты CAPTCHA.
Так работает ли CAPTCHA на самом деле?
Пока что ясно одно — исследования показали, что CAPTCHA, или reCAPTCHA, не останавливает всю нечеловеческую деятельность. Тем не менее, она серьезно ограничивает трафик ботов и останавливает большинство из них на своих треках. Таким образом, в этом смысле мы можем сказать, что CAPTCHA работает, даже если она не имеет 100% успеха.
Возможно, ИИ станет умнее и сможет вести себя как человек, но в этом случае Google откажется от reCAPTCHA v4, или другие разработчики CAPTCHA выпустят что-то новое.
Это как бесконечная игра в кошки-мышки. В конечном счете, веб-сайт намного лучше, если у него есть CAPTCHA, и он может снизить активность ботов с тысяч до почти ничтожных количеств.
CAPTCHA — это… Что такое CAPTCHA?
Искаженная строка
CAPTCHA ([ˈkæptʃə]; от англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей) — товарный знак Университета Карнеги — Меллона, в котором разработали компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. В Рунете часто транскрибируется как «капча». Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую с лёгкостью может решить человек, но которую несоизмеримо сложнее решить компьютеру. По состоянию на 2011 г. примерно 200 миллионов CAPTCHA вводилось каждый день людьми в мире[1].
Варианты реализации
В наиболее распространённом варианте CAPTCHA пользователь вводит символы, изображённые на рисунке (зачастую с добавлением помех или полупрозрачности). По общепринятым нормам доступности интернета для людей со слабым зрением, такая CAPTCHA должна дополняться вариантом, основанным на распознавании речи (аудио-CAPTCHA).
Могут также применяться другие плохо алгоритмизуемые задачи: например, узнать, что находится на картинке, отметить все картинки с кошками или ответить на вопрос, связанный со знаниями или менталитетом людей (например, «висит груша, нельзя скушать»). Тем не менее, стандартом стало именно распознавание символов: оно не привязано ни к какой культуре (основная помеха — слабое зрение), работает даже на мобильных браузерах, и пользователь со стажем быстро опознаёт картинку как CAPTCHA.
Способы прохождения CAPTCHA роботом
Использование уязвимостей
Уязвимость в CAPTCHA
Предположим, картинка с цифрами 1234 вызывается кодом.
<img src="/captcha.php?code=1234" />
Вместо того, чтобы проходить CAPTCHA, компьютер считывает URL и вводит ответ 1234.
При недостаточной квалификации веб-программиста робот может выдать ответ, не проходя тест. Например, по какой-либо информации, содержащейся на странице, компьютер сам, без вмешательства человека, способен правильно ответить на вопрос, на который предположительно мог ответить только человек. Либо человек проходит тест один раз, а компьютер фабрикует множество запросов с тем же ответом.
Угадывание
Применяется в первую очередь для «нетрадиционных» CAPTCHA с небольшим количеством вариантов ответа (1000 и меньше). Робот посылает случайные ответы; некоторые из них оказываются верными.
Использование баз данных
Эффективно, когда вопросы подготавливаются администратором, а не генерируются автоматикой. Этим способом проходятся многие нетрадиционные варианты CAPTCHA: например, отметить все картинки с кошками.
Автоматизированное распознавание
Очень слабая CAPTCHA (на примере phpBB) К верхнему изображению применяется отсечка по яркости (всё, что темнее некоторого порога, становится чёрным, остальное — белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужен даже OCR, поскольку в ней есть сразу несколько уязвимостей:- Лёгкое отделение символов от фона с помощью цветового ключа.
- Лёгкое отделение символов друг от друга.
- Фиксированный и неискажённый шрифт.
После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут опознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен.
В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки GD.
Существуют программы (к примеру, PWNtcha), распознающие конкретные реализации CAPTCHA. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например, FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок CAPTCHA.
По отношению к автоматизированному распознаванию существуют понятия «слабая CAPTCHA» и «сильная CAPTCHA». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что сильная CAPTCHA оказывается труднораспознаваемой и для человека. Изредка встречается CAPTCHA, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой).
Если сгенерированная картинка оказалась нечитаемой, пользователь, как правило, имеет возможность получить новую. Прочная CAPTCHA должна выдавать картинку с другим ответом[2].
Распознавание чужими руками
Есть способ «распознавания», в соответствии с поговоркой «чужими руками жар загребать», использующий человеческий ресурс с высокопосещаемых сайтов, например, сайтов порно-тематики. Робот скачивает CAPTCHA с нужного интернет-сервиса и предъявляет его посетителю порносайта. Взамен посетитель порносайта получает доступ к порно-ресурсу, а робот узнаёт код, изображённый на картинке, и вводит его на «штурмуемом» сайте. Посетитель порносайта может и не подозревать, что каждый просмотренный порноролик оборачивается регистрацией нового почтового ящика для рассылки спама.
Для защиты (не полной) от такого способа обхождения CAPTCHA, сайт автоматически меняет CAPTCHA-картинку, если ответ на неё не ввели сразу (в течение небольшого промежутка времени), — регулярно каждый раз через определённый период времени, или при попытке начать запоздалый ввод ответа.
Есть также специализированные сайты для обмена или продажи капч.
Оценка капчи
Капчи сами по себе не могут остановить спамеров (1000 капч, распознанных людьми, стоят около $1). С другой стороны, этот метод защиты может создавать большие неудобства людям.
К тому же, капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капч и делает их ещё более неэффективными.[источник не указан 45 дней]
Известные CAPTCHA-службы
reCAPTCHA — проект, использующий в роли рабочего элемента для ответов пользователей на CAPTCHA-запрос неразборчивое для OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки текста книг. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.
KeyCaptcha — проект, предоставляющий вариант капчи, отличный от классической. В его основе лежит взаимодействие с пользователем, которому предлагается выполнить какое-либо задание. К примеру, пользователю предлагается собрать пазл из разрезанной картинки или соотнести несколько различных картинок по изображенному на них признаку. Это упрощает прохождение капчи пользователем, так как классическая капча на некоторых ресурсах часто сложна для восприятия. Минусами же являются то, что она ненадежна, так как может быть программно «распознана»[3], а также является сторонним сервисом, который напрямую заряжает исполняемые скрипты в браузер посетителей из своих бэксерверов, что вебмастер защищаемого ресурса не может контролировать. Последнее делает из неё удобное средство несанкционированных слежки, сбора информации, распространения рекламы, а также взлома компьютеров, как правоохранительными органами, так и частными структурами[4]
Примечания
Ссылки
CAPTCHA — это… Что такое CAPTCHA?
Искаженная строка smwm
CAPTCHA ([ˈkæptʃə]; от англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей) — товарный знак Университета Карнеги — Меллона, в котором разработали компьютерный тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. В Рунете часто транскрибируется как «капча». Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую с лёгкостью может решить человек, но которую несоизмеримо сложнее решить компьютеру. По состоянию на 2011 г. примерно 200 миллионов CAPTCHA вводилось каждый день людьми в мире[1].
Варианты реализации
В наиболее распространённом варианте CAPTCHA пользователь вводит символы, изображённые на рисунке (зачастую с добавлением помех или полупрозрачности). По общепринятым нормам доступности интернета для людей со слабым зрением, такая CAPTCHA должна дополняться вариантом, основанным на распознавании речи (аудио-CAPTCHA).
Могут также применяться другие плохо алгоритмизуемые задачи: например, узнать, что находится на картинке, отметить все картинки с кошками или ответить на вопрос, связанный со знаниями или менталитетом людей (например, «висит груша, нельзя скушать»). Тем не менее, стандартом стало именно распознавание символов: оно не привязано ни к какой культуре (основная помеха — слабое зрение), работает даже на мобильных браузерах, и пользователь со стажем быстро опознаёт картинку как CAPTCHA.
Способы прохождения CAPTCHA роботом
Использование уязвимостей
Уязвимость в CAPTCHA
Предположим, картинка с цифрами 1234 вызывается кодом.
<img src="/captcha.php?code=1234" />
Вместо того, чтобы проходить CAPTCHA, компьютер считывает URL и вводит ответ 1234.
При недостаточной квалификации веб-программиста робот может выдать ответ, не проходя тест. Например, по какой-либо информации, содержащейся на странице, компьютер сам, без вмешательства человека, способен правильно ответить на вопрос, на который предположительно мог ответить только человек. Либо человек проходит тест один раз, а компьютер фабрикует множество запросов с тем же ответом.
Угадывание
Применяется в первую очередь для «нетрадиционных» CAPTCHA с небольшим количеством вариантов ответа (1000 и меньше). Робот посылает случайные ответы; некоторые из них оказываются верными.
Использование баз данных
Эффективно, когда вопросы подготавливаются администратором, а не генерируются автоматикой. Этим способом проходятся многие нетрадиционные варианты CAPTCHA: например, отметить все картинки с кошками.
Автоматизированное распознавание
Очень слабая CAPTCHA (на примере phpBB) К верхнему изображению применяется отсечка по яркости (всё, что темнее некоторого порога, становится чёрным, остальное — белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужен даже OCR, поскольку в ней есть сразу несколько уязвимостей:- Лёгкое отделение символов от фона с помощью цветового ключа.
- Лёгкое отделение символов друг от друга.
- Фиксированный и неискажённый шрифт.
После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут опознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен.
В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки GD.
Существуют программы (к примеру, PWNtcha), распознающие конкретные реализации CAPTCHA. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например, FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок CAPTCHA.
По отношению к автоматизированному распознаванию существуют понятия «слабая CAPTCHA» и «сильная CAPTCHA». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что сильная CAPTCHA оказывается труднораспознаваемой и для человека. Изредка встречается CAPTCHA, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой).
Если сгенерированная картинка оказалась нечитаемой, пользователь, как правило, имеет возможность получить новую. Прочная CAPTCHA должна выдавать картинку с другим ответом[2].
Распознавание чужими руками
Есть способ «распознавания», в соответствии с поговоркой «чужими руками жар загребать», использующий человеческий ресурс с высокопосещаемых сайтов, например, сайтов порно-тематики. Робот скачивает CAPTCHA с нужного интернет-сервиса и предъявляет его посетителю порносайта. Взамен посетитель порносайта получает доступ к порно-ресурсу, а робот узнаёт код, изображённый на картинке, и вводит его на «штурмуемом» сайте. Посетитель порносайта может и не подозревать, что каждый просмотренный порноролик оборачивается регистрацией нового почтового ящика для рассылки спама.
Для защиты (не полной) от такого способа обхождения CAPTCHA, сайт автоматически меняет CAPTCHA-картинку, если ответ на неё не ввели сразу (в течение небольшого промежутка времени), — регулярно каждый раз через определённый период времени, или при попытке начать запоздалый ввод ответа.
Есть также специализированные сайты для обмена или продажи капч.
Оценка капчи
Капчи сами по себе не могут остановить спамеров (1000 капч, распознанных людьми, стоят около $1). С другой стороны, этот метод защиты может создавать большие неудобства людям.
К тому же, капчей злоупотребляют, например, файловые хостинги, что несёт в массы сервисы по распознаванию капч и делает их ещё более неэффективными.[источник не указан 45 дней]
Известные CAPTCHA-службы
reCAPTCHA — проект, использующий в роли рабочего элемента для ответов пользователей на CAPTCHA-запрос неразборчивое для OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки текста книг. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.
KeyCaptcha — проект, предоставляющий вариант капчи, отличный от классической. В его основе лежит взаимодействие с пользователем, которому предлагается выполнить какое-либо задание. К примеру, пользователю предлагается собрать пазл из разрезанной картинки или соотнести несколько различных картинок по изображенному на них признаку. Это упрощает прохождение капчи пользователем, так как классическая капча на некоторых ресурсах часто сложна для восприятия. Минусами же являются то, что она ненадежна, так как может быть программно «распознана»[3], а также является сторонним сервисом, который напрямую заряжает исполняемые скрипты в браузер посетителей из своих бэксерверов, что вебмастер защищаемого ресурса не может контролировать. Последнее делает из неё удобное средство несанкционированных слежки, сбора информации, распространения рекламы, а также взлома компьютеров, как правоохранительными органами, так и частными структурами[4]
Примечания
Ссылки
Каптча — это… Что такое Каптча?
Очень слабая CAPTCHA (на примере К верхнему изображению применяется отсечка по цвету (всё, что темнее некоторого порога, становится чёрным, остальное белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужен даже OCR, поскольку в ней есть сразу несколько уязвимостей:- Лёгкое отделение символов от фона с помощью цветового ключа.
- Лёгкое отделение символов друг от друга.
- Фиксированный и неискажённый шрифт.
После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут опознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен. В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки PWNtcha. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например, FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок CAPTCHA.
По отношению к автоматизированному распознаванию существуют понятия «слабая CAPTCHA» и «прочная CAPTCHA». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что прочная CAPTCHA оказывается труднораспознаваемой и для человека. Изредка встречается CAPTCHA, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой).
Даже если бот проходит CAPTCHA один раз из 100, этого хватает, чтобы посылать 430 сообщений в сутки (предполагается, что производительность бота — 1 запрос в 2 секунды, что приблизительно соответствует неоптимизированному алгоритму, запущенному в фоновом режиме на ПК средней мощности. Но чаще такие боты устанавливаются на серверах, у которых производительность в сотни раз выше, нежели у ПК рядовых пользователей).
Ручное распознавание
Есть способ «распознавания», использующий человеческий ресурс и ресурс высокопосещаемых сайтов, например, сайтов порно-тематики. Робот скачивает CAPTCHA с интернет-сервиса и показывает его пользователю порносайта, с просьбой ввести код, который он видит на картинке. Взамен пользователь получает доступ к ресурсу, а робот узнаёт код, изображённый на картинке («метод леммингов»). Пользователь может и не подозревать, что каждый просмотренный порноролик оборачивается регистрацией нового почтового ящика для рассылки спама.
Вариантом этого метода является сервис Captcha Exchange Server, запущенный в марте 2007 года и направленный на обход картинок CAPTCHA, используемых файлообменниками. Принцип работы сервиса основан на системе баллов, которые пользователь может заработать, распознав картинки для других пользователей, и позже потратить, запустив программу автоматического скачивания с файлообменников, при этом картинки будут распознаны другими пользователями сервиса. Таким образом, пользователь может оптимизировать затраты своего времени и денег, набирая баллы, когда он всё равно находится у компьютера, и тратя их, когда ему более удобно скачивать (например, в случае, если ночью доступ в интернет обходится дешевле).
Несмотря на уязвимости, это не означает, что любая CAPTCHA-защита априори бессмысленна. Тут наблюдается извесный принцип соревнования оружия и защиты (снаряда и брони). Гораздо хуже, если данная защита не используется.
reCAPTCHA
OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки текста книг. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.
Ссылки
Wikimedia Foundation. 2010.
Каптча — это… Что такое Каптча?
Очень слабая CAPTCHA (на примере К верхнему изображению применяется отсечка по цвету (всё, что темнее некоторого порога, становится чёрным, остальное белое). Определяются границы символов, и каждый из них сравнивается с базой символов. Для разбора такой CAPTCHA не нужен даже OCR, поскольку в ней есть сразу несколько уязвимостей:- Лёгкое отделение символов от фона с помощью цветового ключа.
- Лёгкое отделение символов друг от друга.
- Фиксированный и неискажённый шрифт.
После отсечки на буквах образуется случайный узор, поэтому нет стопроцентной гарантии, что все символы будут опознаны (в PWNtcha рейтинг этой CAPTCH’и — 99 %). Но оставшийся один процент совершенно не важен. В новой линейке форума phpBB (3.x.x) по умолчанию используется усовершенствованная CAPTCHA с использованием библиотеки PWNtcha. Кроме того, существует возможность подключать модули из программ распознавания текста общего назначения (например, FineReader, OmniPage) в программы сторонних разработчиков для распознавания картинок CAPTCHA.
По отношению к автоматизированному распознаванию существуют понятия «слабая CAPTCHA» и «прочная CAPTCHA». В числе «слабостей» — фиксированный шрифт, фиксированное положение символов, отсутствие искажений, отделение символов от фона с использованием цветового ключа или размытия по Гауссу, лёгкое отделение символов друг от друга и т. д. Впрочем, иногда бывает, что прочная CAPTCHA оказывается труднораспознаваемой и для человека. Изредка встречается CAPTCHA, легко прочитываемая компьютером и с большими трудностями — человеком (например, с неконтрастной картинкой).
Даже если бот проходит CAPTCHA один раз из 100, этого хватает, чтобы посылать 430 сообщений в сутки (предполагается, что производительность бота — 1 запрос в 2 секунды, что приблизительно соответствует неоптимизированному алгоритму, запущенному в фоновом режиме на ПК средней мощности. Но чаще такие боты устанавливаются на серверах, у которых производительность в сотни раз выше, нежели у ПК рядовых пользователей).
Ручное распознавание
Есть способ «распознавания», использующий человеческий ресурс и ресурс высокопосещаемых сайтов, например, сайтов порно-тематики. Робот скачивает CAPTCHA с интернет-сервиса и показывает его пользователю порносайта, с просьбой ввести код, который он видит на картинке. Взамен пользователь получает доступ к ресурсу, а робот узнаёт код, изображённый на картинке («метод леммингов»). Пользователь может и не подозревать, что каждый просмотренный порноролик оборачивается регистрацией нового почтового ящика для рассылки спама.
Вариантом этого метода является сервис Captcha Exchange Server, запущенный в марте 2007 года и направленный на обход картинок CAPTCHA, используемых файлообменниками. Принцип работы сервиса основан на системе баллов, которые пользователь может заработать, распознав картинки для других пользователей, и позже потратить, запустив программу автоматического скачивания с файлообменников, при этом картинки будут распознаны другими пользователями сервиса. Таким образом, пользователь может оптимизировать затраты своего времени и денег, набирая баллы, когда он всё равно находится у компьютера, и тратя их, когда ему более удобно скачивать (например, в случае, если ночью доступ в интернет обходится дешевле).
Несмотря на уязвимости, это не означает, что любая CAPTCHA-защита априори бессмысленна. Тут наблюдается извесный принцип соревнования оружия и защиты (снаряда и брони). Гораздо хуже, если данная защита не используется.
reCAPTCHA
OCR слово, являющееся одним из множества искажённых фрагментов сканированных книг в дополнение к слову, сгенерированному компьютером. Этот сервис учитывает приёмы использования и возможности программ оцифровки текста книг. Для надёжности одно и то же слово предлагается нескольким пользователям различных сайтов. Когда разные пользователи одинаково ответили на CAPTCHA-запрос, предполагается, что они ввели правильное слово.
Ссылки
Wikimedia Foundation. 2010.
Капча — Lurkmore
Пример капчи. Символы изогнуты для усложнения задачи машинного распознавания текстов.
Ка́пча, ка́птча (CAPTCHA, Completely Automatic Public Turing Test to Tell Computers and Humans Apart) — механизм, с помощью которого веб-сайт отличает людей от наиболее тупых роботов (ботов, программ-роботов), заставляя их проходить обратный тест Тьюринга. Обычно пользователю предлагается ввести в поле формы выражение из цифр и букв разного регистра, изображённое на автоматически сгенерированной картинке.
Применение
На ЛуркеКапчи используются как защита от спама, автоматических регистраций, флуда и накруток. На анонимных имиджбордах капча обычно используется для предотвращения скриптового вайпа. Как правило она есть на всех имиджбордах в постоянном режиме.
С развитием алгоритмов и технологий распознавания текста применение классических покрученных букв становится неэффективным. Например, студентам рассказывают про алгоритм Кока-Янгера-Касами распознавания двухмерной грамматики, которым «выносится» добрая половина подобных капч. Другие товарищи, менее продвинутые в теоретическом плане, но более прокачанные в отношении хакерства, подключают подпрограммы из новейших версий FineReader-а непосредственно к своим спам-ботам. Поэтому авторы капч вынуждены извращаться по-всякому.
Очень часто капчу усложняют так, что её становится трудно прочитать не только программе-роботу, но и человеку[1].
Иногда это становится и вовсе невозможно, ввиду чего капча уже не может больше именоваться капчей в том смысле, который в неё вкладывают в интернетах и становится больше похожа на чернильное пятно из психологических тестов Роршаха. Конечно, человек и бот всё ещё воспринимают её по разному, но ввиду того, что проверяет результат тоже компьютер, он примет правильный, например случайно получившийся, ответ на такую капчу от бота, но не примет комментарий «что за нечитаемая хуита?» от человека. Увы, чтобы достоверно отличить человека и бота при нынешних технологиях, пока ещё нужен человек[2].
Иногда капча может выдавать осмысленные слова, картинки с которыми сохраняются и затем с гордостью показываются другим. На ЛОРе это приняло столь массовый характер, что привело к полному запрету на цитирование капчи. На Уютненьком в обсуждениях можно встретить: «Капча %s %s как бы намекает»[3].
На файлообменниках капча ставится, чтобы скачивающий не смог накидать ссылок в качалку файлов, а ручками зашёл на сайт и посмотрел рекламу.
На nnm.ru капча требует знания высшей математики. К счастью, там она нужна только для регистрации. При других действиях такое извращение не применяется. Другой пример экстремальной капчи — cirno.ru, где для успешного прохождения теста требуется знание японской иероглифики и немало усидчивости.
На Доброчане капча генерируется из постов, при практическом отсутствии искажения картинки. В результате порой получаются странные выражения, что породило легенду о том, что капчу Доброчана придумывает лично Осака.
Фольклор IIchan
Капча-тян — одна из многочисленных малоизвестных ычановских маскотовНерешительность — это когда в капче ставишь многоточие…
Убедительность — это когда проверка капчи проходит успешно даже тогда, когда вводишь её неправильно.
Вырождение — это когда капча начинает совпадать с сообщением.
Постмодернизм — это когда капча кажется законченным литературным произведением.
Творческая свобода — это когда в капче оставлены пробелы для импровизации.
Верная мысль — это когда даже капча подтверждает.
Авторские права — это когда заполнение капчи получает статус личной переписки.
Нанотехнологии — это когда капча занимает один пиксель.
Тиреч — это когда капча твой первый вступительный экзамен.
Бюрократия — это когда нужно заполнить бланк в трёх экземплярах, чтобы получить разрешение на заполнение капчи.
Жизнь удалась — это когда капчу за тебя вводит секретарша.
Настоящий граммар-наци — это когда указывают на ошибки в капче, аргументируя Розенталем и Ожеговым
Хорошо структурированный бизнес — это когда капчей занимается отдел по вводу капчи.
Локальный ресурс — это когда для ввода капчи нужно звонить в техподдержку провайдера.
Олдфаг — это когда капчу вводишь по памяти.
Майкрософт — это когда после неправильно вбитой капчи предлагается отправить отчет об ошибке.
Криптография — это когда текст на картинке меняется в зависимости от того, какую капчу ты вводишь, и нужно добиться совпадения.
Скука — это когда обновляешь капчу, пока не появится какое-нибудь прикольное слово.
Маркетинговая сеть — это когда после ввода капчи тебе надо заставить 20 людей ввести капчу по твоему приглашению, и за это ты получаешь право вводить VIP-капчу.
Есть-одна-тян тред — это когда капча что-то вроде прелюдии.
Религия — это когда не видишь капчу, но знаешь, что она есть, и требуешь ото всех её вводить.
Деспотия — это когда вместо капчи вводишь коня.
Просветление — когда ты понимаешь, зачем нужен каждый символ капчи.
Word — это когда в капче автоматически высвечиваются ошибки, предлагаются капчи для замены и капчи-синонимы.
На уютненьком
Вот такое проходит.Используется ставшая модной в последнее время Re-Captcha, о которой ниже. Зарегистрированные пользователи могут от неё избавиться, внеся более 9000 правок. Когда-то это число равнялось всего 30, но после некоторых событий пришлось несколько ужесточить правила. Точное число теперь определяется Всемогущей Администрацией.
Re-Captcha
Происки Пиндостана для распознавания книг (как правило, англоязычных). Одно из слов, изображённых на картинке — нераспознанное слово из скана книги, журнала или газеты. Оно, как правило, более нечёткое, размытое, содержит буквы разного регистра и цифры или может быть отрывком слова, но в большинстве случаев слово не выглядит искажённым, все буквы находятся на одной линии. Его и распознаёт анонимус, вводящий слово, соответствующее изображению. Для прохода же капчи достаточно ввести лишь четко изображённое и искажённое машиной (как правило, закрученное и/или зачёркнутое) слово, а размытое заменять на «Fuck» (Форчан пропагандирует слово «nigger») (или «хуй», система хавает кирилицу). Цитата 71704. Фейл этого состоит в том, что одно и то же слово показывается нескольким анонимусам, и окончательным считается наиболее частый вариант (то есть писать там «хуй», «песда», «хуйпесда» или «идите_на_хуй_пиндосы!» — забавно, но бессмысленно). Поэтому, для того чтобы этот фокус прокатил, необходимо, чтобы все участники этой акции вводили «fuck» (дабы и у пользователей, владеющих английским языком, не было сложностей с участием в акции). Начните прямо сейчас же, при редактировании уютненького!
В последнее время некоторые буквы проверочного слова рекапчи стали окрашиваться белым, лишь их контуры остаются черным. (а теперь они ещё и «сдваиваются»). Это слегка осложняет опознавание слова, но в разы облегчает детектирование самого слова, которое сгенерировала рекапча и соответственно того, которое она надеется узнать от вас. Такой трюк будет прокатывать до тех пор, пока не станут генерировать похожее на скан. А пока распознать, где там Fuck, а где капча — легко.
Последнее время кончилось, и рекапча с двумя словами заменена злобным гуглом сначала на одну размытую цифру со Street View, а затем и на простую галочку на основе слежки АНБ хитрых алгоритмов анализа поведения пользователя и оценки рисков. Скайнет уже в наших телефонах, однако.
Алсо
На расово чувашском языке «капща» означает женскую половую пизду.
Галерея
Иногда мне кажется что у них есть свои семьи, города, чувства. | ||||
---|---|---|---|---|
1 | 3 | yes | Показать | Скрыть |
|
Ссылки
См. также
Примечания
- ↑ Цитата: «Сделайте нормальный код подтверждения, глазами очень плохо читаем, не то что ботами…»
- ↑ Потом нужно будет много человеков, а потом отличить и вовсе будет невозможно.
- ↑ Так называемое гадание по капче популярно не только на уютненьком, но и на АИБ, раньше на лоре, и вообще, часто применяется на других ресурсах, в силу мобильности фагготрии выше указанных ресурсов.