- Что такое капча
- Что такое капча при регистрации
- Минусы капчи
- Для чего она нужна
- Защита от взлома
- Защита от спама
- Защита от перегрузки
- Какие есть виды капчи?
- ReCAPTCHA
- Распознавание текста/цифр
- Логические
- Образные
- Как распознать капчу
- Можно ли автоматически распознать капчу
- Как связаны капча и рукописи
- Как это выглядит
- Как технически это устроено
- Какую капчу выбрать для своего сайта?
- Что дальше
- Как заработать на капче
- Стоит ли на этом зарабатывать
- Зрение
- Отсутствие роста
Что такое капча
Итак, капча – это обычно буквы и цифры, значительно реже – знаки препинания. Они написаны неровно, с искажениями, на разном фоне, с какими-то дополнительными элементами – разными линиями, кружками и т д.
Вот пример довольно простой капчи.
Что такое капча при регистрации
Многие задаются вопросом, что такое капча при регистрации и зачем она нужна. Да, мы часто сталкиваемся с капчами при заполнении регистрационных форм. Например, вы думаете о том, как найти человека по почте, для этого вам необходимо зарегистрироваться. Это совершенно нормально и безвредно. В таких случаях капча направлена на борьбу с ботами, которые создают множество аккаунтов для рассылки спама.
Билетные сайты также используют кодировку, чтобы не дать скальперам перекупить билеты на крупные мероприятия. Это позволяет законным клиентам справедливо приобретать билеты и не позволяет скальперам размещать тысячи заказов.
Наконец, веб-сайты или блоги, содержащие доски объявлений, такие как стоимость разработки веб-сайтов или контактные формы, используют капчу для предотвращения спам-сообщений или комментариев. То есть помогает избежать автоматической публикации сообщений роботами.
Минусы капчи
Современная капча имеет два основных недостатка:
- Существуют нейросети, которые легко обходят практически любую капчу.
- Капча становится настолько сложной, что человек не всегда может ее пройти.
Получается, что сейчас от капчи в некоторых случаях больше вреда, чем пользы: эффекта мало, но сервисом невозможно пользоваться из-за сложности алгоритмов.
Есть мнение, что капча скоро исчезнет и станет фоновой службой на сайте. Он будет следить за действиями пользователя и постоянно пытаться понять, находится ли этот человек в данный момент на сайте или в другой нейросети. А пока этого не произошло – мы будем отгадывать слова и выбирать львов на картинках.
Для чего она нужна
Он действует как барьер для роботов. Помогает различным программам и сервисам обнаруживать ботов и блокировать их действия. Например, здесь я запускаю бота, который рассылает рекламные сообщения пользователям Вконтакте. Он просто выбирает случайного человека в ВК и отправляет ему объявление.
Вот так мой бот спамит то одного человека, то другого, третьего, десятого. И тут ВК замечает, что кто-то рассылает слишком много однотипных сообщений. И показывает капчу. Робот либо вообще не вводит капчу, либо вводит ее неправильно. В результате деятельность блокируется.
Это приводит к нескольким полезным последствиям, давайте рассмотрим их.
Защита от взлома
Если бы не было капчи, постепенно можно было бы взломать многие аккаунты без двухфакторной аутентификации. То есть вы создали учетную запись, защитили ее только одним паролем. Как взломать аккаунт? Всегда выбирайте пароль. Робот может сгенерировать тысячи паролей за короткое время и вполне вероятно, что рано или поздно он сможет найти правильный.
Если этого робота не остановить вовремя капчей.
Защита от спама
В целом в Интернете ведется жесткая борьба со спамом. Помимо капчи, программы и сервисы учитывают жалобы пользователей, анализируют источники спама и постоянно пытаются изобретать все новые и новые методы борьбы со злонамеренными спамерами.
Защита от перегрузки
Очень легко перегрузить любой сайт или сервис. Необходимо отправлять ему слишком много запросов в единицу времени, чтобы он не успевал их обрабатывать. Эти запросы могут быть отправлены только с использованием автоматизированного вредоносного ПО.
А капча — тот самый спаситель, который их остановит.
Какие есть виды капчи?
Рассмотрим самые простые и удобные капчи, используемые на большинстве сайтов.
ReCAPTCHA
Чеки из поисковой системы Google, самые простые и удобные. Для завершения просто поставьте галочку возле слов «Я не робот». Через мгновение появится зеленая галочка, означающая, что проверка завершена.
Но система все равно может провести дополнительную проверку, перенаправив вас на страницу выбора необходимых изображений. Например, вам будет предложено нажать на все картинки, где есть буквы.
Распознавание текста/цифр
В поле необходимо написать изогнутые цифры или буквы, указанные на изображении. Слова появляются как на латинице, так и на кириллице. Бывает, что человек просто не может видеть то, что отображается, поэтому для удобства была придумана кнопка «обновить изображение», при нажатии на которую будет отображаться другое. Иногда также есть кнопка, позволяющая произнести содержание изображения.
Логические
В этой капче вам предстоит решить простое арифметическое уравнение, например написать в поле сколько будет 21+42; или решите простую загадку, введя правильный ответ.
Образные
Капча — это изображение. Чтобы пройти тест, вам нужно всего лишь выбрать нужное изображение, например кликнуть по всем изображениям с рыбками.
Как распознать капчу
Обычно у «живого» человека проблем в этом плане не возникает. Мы просто «смотрим» на символы и аккуратно вставляем их один за другим.
Гуманитарные сайты даже добавляют в капчу функцию озвучки — символы произносятся, мы воспринимаем их на слух и набираем на клавиатуре.
Конечно, есть очень сложные капчи, которые невозможно ввести с первого раза. Но к каким-то печальным последствиям это не приводит – просто генерируется новая капча. Живые люди рано или поздно смогут печатать символы любого уровня сложности.
Можно ли автоматически распознать капчу
В целом да, это будет возможно. И происходит это следующим образом. Создается база данных, в нее загружаются тысячи изображений с капчей и расшифровкой. Затем специальная программа сравнивает «кривые» символы с их расшифровкой и «запоминает».
Таким образом вы сможете шаг за шагом научить роботов распознавать отдельные изображения с помощью капчи.
Но это не значит, что «противоядие найдено» и роботы теперь захватят весь Интернет. Такое научиться распознавать капчу – очень непростая задача. Существует множество способов генерации изогнутых, штриховых, полуразмазанных и разных других символов, поэтому автоматическое распознавание пока далеко от совершенства.
Как связаны капча и рукописи
Некоторые сайты просят пользователей ввести две капчи. Значит один из них не распознан, и своим признанием вы делаете доброе дело – помогаете расшифровывать трудночитаемые тексты.
Смотрите, люди решили оцифровать старую-старую газету, где текст очень плохо виден. Сканируют, но машина либо вообще не распознает буквы, либо распознает их неправильно.
И для решения этой проблемы делается следующее. Текст разделен на слова и каждое слово рассылается миллионам людей по всему миру в виде капчи. Люди узнают, а затем результаты распознавания суммируются. И, например, из тысячи человек 900 наберут слово одинаково, а 100 напечатают слово иначе, чем остальные 900. Машина возьмет текст, совпавший с 900 людьми, и вставит его в оцифровку. Конечным результатом станет полностью оцифрованная газета, распознаваемая людьми, а не машиной.
Вот и все.
Чтобы получить немного больше информации, посмотрите это видео.
Как это выглядит
Идея капчи заключается в том, чтобы предоставить задачу, которую человек может легко выполнить, а компьютер — нет (или это потребовало бы гораздо больше времени и ресурсов).
Самый простой пример капчи — проанализировать слова на изображении и ввести их в форму:
Еще одна популярная тема — поиск пешеходных переходов, светофоров или автобусов:
Читайте также: Как восстановить переписку Вконтакте инструкция
Как технически это устроено
Самая первая капча была устроена очень просто: алгоритм переводил текст в изображение, а человек должен был его прочитать и ввести ответ. Сервер сравнивал ответ пользователя с тем, что было записано в его базе данных, и если он совпадал, разрешал что-то делать дальше на сервере.
Текст был написан обычным шрифтом без искажений — тогда алгоритмы компьютерного зрения не были настолько распространены, чтобы их использовали для распознавания капч:
Затем, с усовершенствованием алгоритмов распознавания символов, текст стал более сложным — искаженным, не таким контрастным и не таким четким. С другой стороны, человеку тоже стало труднее читать это:
С развитием нейронных сетей капча изменилась: теперь алгоритмы используют человека как бесплатный инструмент для распознавания сложного текста. Так родился проект Google reCaptcha — алгоритм умеет распознавать первое слово, а второе взято из оцифрованных старых книг и газет. Оказывается, человек отмечает это и помогает Google узнать больше:
Алгоритм показывал одну и ту же капчу разным пользователям, и если большинство указывало одни и те же данные, это считалось правильным ответом. Проект оказался настолько успешным, что за несколько дней после запуска такой капчи удалось оцифровать годовой выпуск старых газет и лихорадочно обучать нейросеть Google».
Теперь нейросети пошли еще дальше и предлагают просто поставить галочку «Я не робот»:
Пока пользователь ставит галочку, нейросеть анализирует действия человека на странице: как он двигает мышкой, как быстро находит галочку, как быстро нажимает, что делает дальше и так далее. Если нейросеть посчитает, что перед ней человек, она пропустит его, а если нет, то покажет те же изображения пожарных гидрантов или автобусов.
Самое интересное, что здесь еще и будет оцениваться не только корректность, но и скорость выбора нужных объектов и поведение на странице. А подбор необходимых объектов, в свою очередь, помогает переобучить модели компьютерного зрения тому же Google».
Какую капчу выбрать для своего сайта?
Многие вебмастера не хотят устанавливать на свой ресурс такую тестовую программу, так как боятся потерять часть своих посетителей. И это опасение не напрасно, ведь по официальной статистике прохождение проверки кода безопасности обычному пользователю занимает около 10 секунд. Конечно, эта процедура никому не нравится.
Ситуацию усугубляет плохое распознавание капчи, из-за чего после ее внедрения сайты теряют около 2-10 процентов посетителей. Следует помнить, что есть пользователи с плохим зрением — после прохождения тестовой проверки им легче покинуть сайт и перейти на другой.
Поэтому важно установить капчу, которая отлично выполняет свои прямые функции (защищает сайт от спама) и не беспокоит пользователей. Для этого он должен соответствовать трем простым требованиям:
- Тест должен решаться легко и быстро при любых обстоятельствах.
- Минимальная регистрация номера/буквы.
- Задача должна быть простой даже для посетителей с сенсорными проблемами.
Многие сервисы используют капчу, где нужно указать то, что изображено на изображении. Но как показывает практика, ответы на логические вопросы гораздо надежнее и интереснее для людей.
Однако текст по умолчанию reCAPTCHA от Google по-прежнему остается самым популярным в наши дни — он наиболее защищен от спамеров, которые продолжают придумывать новые способы обхода проверки. Эта программа постоянно меняет свой алгоритм действий, и теперь в большинстве случаев для прохождения теста достаточно поставить галочку — это займет у вас всего 2-3 секунды, и нет необходимости распознавать и вводить какие-либо буквы. /цифры/картинки.
Помимо reCAPTCHA, владельцы сайтов часто используют следующие капчи:
- яКАПЧА;
- Свободные носители;
- Антиспамовая картинка;
- SI Captcha Анти-Спам.
Что дальше
В следующий раз мы добавим капчу на нашу страницу руководства и посмотрим, как она работает. Заодно узнаем, какие капчи лучше выбрать и чем они отличаются друг от друга на практике.
Как заработать на капче
Сейчас в Интернете есть несколько сайтов, которые платят деньги за распознавание капчи. Самый популярный из них — 2captcha. Остальное я опишу в отдельной статье о сайтах для заработка на капче.
Все эти проекты работают одинаково. Вы регистрируетесь, получаете картинку с символами, вводите символы, получаете оплату.
Уровень сложности капчи очень разный. На некоторых сайтах можно даже выбрать уровень сложности, чтобы не мучиться с слишком замысловатыми изображениями.
Сколько они платят за каждое объявление? Средняя цена составляет $0,3 за 1000 объявлений. Если доллар равен примерно 75 рублям, то получается 22,5 рубля. Вы можете себе это представить, учитывая тысячу введенных капч?
Стоит ли на этом зарабатывать
Я не думаю, что оно того стоит. Даже если вы новичок в мире онлайн-заработка. Кажется, что на электричество вы потратите больше денег, чем сможете получить на этих услугах по распознаванию.
Вот еще несколько недостатков, на которых я хочу заострить ваше внимание.
Зрение
Когда вы узнаете непонятные буквы и цифры, ваши глаза будут постоянно напрягаться. В этом нет ничего хорошего. Если вы будете решать десятки капч каждый день, вам обязательно понадобится сходить к оптику через пару месяцев.
Отсутствие роста
Чтобы зарабатывать больше денег, нужно расти профессионально. Вам предстоит узнать что-то новое, попробовать свои силы в каких-то новых сферах деятельности. В общем, постоянно совершенствуйтесь.
Как капча улучшит вас? Нисколько. Если вы будете заниматься этим десять лет, вы научитесь только распознаванию капчи. Чуть быстрее, чем «нормальный» человек. И не более того.
Кто-то за десять лет выучит несколько языков программирования, кто-то станет вторым Ильяховым, а кто-то, может быть, даже Маском.