Пост про капчу. Много, очень много раз встречал подобные мемы, в которых человечеству прогнозируют скорый конец, потому что компьютеры научились расшифровывать капчу.
Изначально - идея была именно в этом, что бы отсеивать людей и компьютеры, но все поменялось..
Немного истории и терминов.
CAPTCHA — англ. Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей.
Стандартная интерпретация Теста Тьюринга: "Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор".
То есть тест Тьюринга должен был дать ответ на вопрос, может ли машина мыслить как человек. Но в 1990-х годах возникла потребность в более продвинутой проверке, с развитием сети интернет и появлением ботов и спамеров необходимо было различать уже "живых пользователей" от неугодных. Таким образом встала задача создать тест, который сможет решить любой человек, любого возраста и уровня образования, но не компьютер. При этом правильность решения такого теста должен был определять компьютер.
Луис Фон Ан — аспирант в американском университете Карнеги-Меллон, первопроходец в мире "капчевания". Именно ему в голову пришла мысль, что человек способен распознавать текст под любым углом, игнорирую искажения или некачественное освещение, боты тех лет на такое не были способны.
Так Yahoo запустили одними из первых капчу EZ-Gimpy, которая стала своего рода стандартом в интернете.
В 2005 году Фон Ан понимает, что на создание и решении капчи уходит множество человеко-часов и необходимо эту историю автоматизировать. Так была создана reCAPTCHA. И на этом этапе люди начали обучать ИИ читать.
Сервис рекапча помимо своей основной задачи (разделение пользователей на людей и ботов) использовал результаты текста для оцифровки текста.
Принцип работы: существует огромный печатный архив, который нужно перевести в цифровой вид. Обычно этим занималась специальная сканирующая система. Но у нее были свои недостатки — например, она не могла прочесть нечеткие надписи из-за расплывшихся чернил или других дефектов. У человека же не возникало никаких сложностей.
В итоге reCAPTCHA показывала пользователям пары слов. Первое проверяющий компьютер уже знал, а второе брали из сканов старых номеров The New York Times. Если человек правильно вводил первое слово, компьютер предполагал, что со вторым пользователь тоже справился. Его сверяли с еще нескольким вариантами расшифровки. Если совпадение подтверждалось, человека пускали на сайт.
Люди так часто проходили капчу, что годовой объем статей NYT расшифровывали каждые четыре дня. В 2009 году Google приобрела reCAPTCHA и с ее помощью запустила «Гугл-книги» — амбициозный проект по оцифровке всех существующих книг. К 2019 году компании с помощью капчи удалось отсканировать более 40 миллионов книг.
Сервис reCAPTCHA постепенно эволюционировал. В 2014 году появилась вторая версия. Теперь уже система не оцифровывала книги, а улучшала работу «Гугл-карт». Да, речь про уже легендарную капчу, где нужно правильно отметить велосипеды, автобусы и пожарные гидранты. Вы делаете это не просто так.
Пока мы решали капчу, машины совершенствовались. Ведь в тесте человек объяснял компьютеру, как правильно расшифровать слово или различить объект. И тем самым учил систему. Со временем у компьютера скопилось так много знаний о прохождении капчи, что он сам стал во всем разбираться, да еще и лучше, чем люди.
Исследование Google 2014 года показало, что человек мог расшифровать самую сложную буквенную капчу с точностью в 33%. Нейросеть же даже с технологиями того времени справлялась с точностью 99,8%.
В целом про Капчу можно целый фильм снять, информации очень много, грузить не стану, добавлю немного интересностей:
Решая капчу на сайте - вы не столько подтверждаете свою человечность, сколько обучаете нейросети.
Подтверждение вашей человечности - ваши куки, ваш аккаунт и в целом поведение на странице (боты не водят курсором туда-сюда).
P.S. контент не авторский, не претендую, собрал информацию с разных ресурсов, решил поделиться. Даже если для тебя, мой читатель, эта инфа - баян и очевидно, то для других, не столь образованных и технически подкованных читателей (как и я) - это неочевидная и новая информация, может даже полезная.
Спасибо, что прочитали. Мне приятно.