우리 중 많은 사람들이 Google 크롬을 통해 사이트에 액세스하려고 할 때 표시되는 팝업으로 인해 짜증나고 답답하다고 느꼈습니다. 한 번은 질문하는 것이 가장 어리석은 것처럼 보입니다. 특히 그것이 계속해서 얼굴에 나타나는 경우라면 더욱 그렇습니다. 그것은 브라우저가 당신의 개인 검색에 들어가려고 하는 어떤 기계가 아니라는 것을 결정할 수 있게 해주는 챌린지-응답 테스트인 CAPTCHA입니다. CAPTCHA는 스팸 봇을 인터넷에서 차단하고 남용을 방지하기 위한 일반적인 보호 수단이 되었습니다. 그러나 최근 몇 년 동안 CAPTCHA가 확장되었으며 소위 응답 챌린지에 집중해야 하는 복잡한 작업이 되었습니다. 브라우저에서 "로봇이 아닙니다"라는 확인 메시지를 표시하는 이유는 무엇입니까? 그리고 그것이 어떻게 성가시고 시간 소모적인 도전으로 바뀌었을까요? 스팸봇을 제거하기 위한 도구로 시작한 것이 이제 어떻게 인간과 기계의 치열한 경쟁이 되었는지 읽어보십시오.
보안문자란 무엇입니까?
CAPTCHA는 완전 자동화된 공개 튜링 테스트의 약자입니다. 2000년대 초반에 인간이 브라우저 보안을 침해하려는 기계나 스팸 봇이 아님을 증명하기 위한 테스트로 개발되었습니다. CAPTCHA의 발명은 또 다른 논쟁거리이지만, 가장 초기 버전은 1997년으로 거슬러 올라갑니다. CAPTCHA가 처음 사용되었을 때 CAPTCHA는 사용자에게 간단한 텍스트에 일련의 왜곡된 문자를 입력하여 "인간성"을 증명하도록 요청했습니다. 일부 시퀀스에서는 왜곡된 문자가 유사한 왜곡된 형식으로 작성된 숫자로 결합되었습니다. 이 문자는 문자 사이에 공백이 없는 방식으로 작성되었으며 로그인을 시도할 때마다 코드가 변경되었습니다. 이것은 거의 무한한 수의 왜곡된 시퀀스를 디코딩하기 위해 약간의 인간 지능이 항상 필요하기 때문에 수행되었습니다. 반면, 컴퓨터 기계 알고리즘은 왜곡된 시퀀스를 감지할 수 없습니다. 따라서 CAPTCHA는 많은 웹 및 메일 서비스 제공업체에서 즉시 채택했습니다.
그러나 다음 몇 년 동안 CAPTCHA는 복잡해졌습니다.
Google의 reCAPTCHA:원래 테스트로의 복잡한 업그레이드
2007년 Google은 시스템의 독창적인 연구원 그룹으로부터 reCAPTCHA라는 프로그램을 구입하여 Google Scholar와 Google Books에서 광범위하게 사용하기 시작했습니다. 그러나 시작된 곳에서 이 최신 형식의 CAPTCHA는 Google 사용자에게 골칫거리가 되었습니다. 기계 학습에 대한 연구가 늘어남에 따라 복잡한 문제를 해결하는 컴퓨팅 시스템과 알고리즘의 능력도 커졌습니다. 따라서 원래의 캐릭터 시퀀스는 봇과 기계가 풀기 너무 쉬워졌습니다. 그래서 구글은 그 캐릭터를 인간의 눈에 더 왜곡되고 기술적으로 더 혼란스럽게 만들었습니다. 이것은 실제로 인간과 기계 지능 간의 실제 경쟁을 시작했으며, 이는 Google 사용자에게 reCAPTCHA가 된 실제 성가심으로 전환되었습니다. Google 플랫폼 및 검색에 액세스하는 사용자가 일부 봇이 아님을 확인하기 위해 Google은 시퀀스를 더 풀기 어렵게 만들었습니다.
테스트에 이미지 추가:Google의 No CAPTCHA reCAPTCHA
Google이 reCaptcha를 인수한 후 훨씬 늦은 2014년에 시퀀스로 인해 사용자에게 문제가 발생했을 때 조치를 취하기로 결정했습니다. 또한, 지난 몇 년 동안 더 스마트한 기계를 만들기 위해 연구원들은 다시 한 번 reCAPTCHA의 대응 과제 이해 능력을 능가했습니다. 실험적 테스트에서 Google 연구원은 극도의 복잡함과 성가신 팝업에도 불구하고 기계 학습 알고리즘은 응답의 99% 이상을 올바르게 얻을 수 있는 반면 우리 인간은 33%를 간신히 관리한다고 결정했습니다. 이제 변화가 필요한 시점이었습니다.
Google은 사용자의 성가심을 없애기로 결정했습니다. 새로운 "NoCAPTCHA reCAPTCHA"를 통해 사용자는 체크박스를 클릭하기만 하면 테스트에 통과할 수 있습니다. 이번에는 Google에서 API 기술을 더 발전시켜 사용자 선호도를 사용하여 사람인지 로봇인지 결정했습니다. Google의 새로운 reCAPTCHA는 사용자 검색과 마우스 커서의 움직임을 분석했습니다. 봇은 봇과 마찬가지로 마우스 클릭을 에뮬레이트할 수 없습니다. 특정 CAPTCHA 테스트에 대한 코드를 분석하면 해당 가상 체크 상자가 그래픽 이미지로 표시되고 이에 응답하지 않습니다. 하지만 봇이 JavaScript를 읽을 수 있다면 쉽게 에뮬레이트할 수 있으며 마우스 움직임 추적 옵션은 실패합니다.
그래서 어떻게 그 문제를 제대로 이해하고 있습니까? 선호하는 것과 다른 검색을 했다면 어떻게 될까요?
글쎄, 그렇다면 다른 테스트에 오신 것을 환영합니다. Google의 새로운 reCAPTCHA는 당신이 인간인지 로봇인지 확인하기 위한 일련의 "시력 테스트"로 안내합니다. 따라서 참조되지 않거나 의심스러운 검색을 하는 경우 Google은 전체 그룹에서 특정 이미지를 선택하도록 요청할 것입니다. 우리 모두는 Google이 신호등, 자동차, 공원 또는 도로 표지판이 있는 사진을 식별하도록 요청하는 것을 알고 있습니다. 맞습니까? 이것이 바로 NoCAPTCHA reCAPTCHA입니다.
이것은 가장 업데이트되고 가장 널리 사용되는 CAPTCHA 버전으로, Google뿐만 아니라 Twitter, Facebook, Craigslist와 같은 플랫폼에서 사용자의 소셜 미디어 프로필의 스팸 및 남용을 방지하기 위해 인간-AI 구분 매체로 사용됩니다. 그러나 다시 한 번, 이 버전의 사진은 사람의 눈에 흐릿해져서 퍼즐의 복잡성을 증가시켰고, 다시 reCAPTCHA가 이전에 갔던 동일한 경로를 가로질러 왔습니다.
그런데 왜요?
CAPTCHA 퍼즐이 왜 그렇게 복잡한가요?
CAPTCHA는 봇과 기계가 인간 사용자를 모방하여 잘못된 수단으로 모든 종류의 데이터에 액세스하는 것을 방지하기 위한 매체로 시작되었습니다. 그러나 기계 학습과 인공 지능에 대한 연구와 실험이 너무 지나쳐 성공하기까지 하여 우리는 훨씬 복잡한 계산을 해결할 수 있는 기계를 만들었고 CAPTCHA는 케이크 조각이 되었습니다. 과학은 기계에게 광범위한 능력을 부여하여 이제 우리가 소프트웨어나 봇을 위해 어려운 것을 만들려고 하면 인간이 해독하기 더 어려워질 것입니다.
CAPTCHA가 어떻게든 실패하는 것이 너무 놀랍습니까?
절대 아니다. 우리는 기능적 양자 컴퓨터를 만들었습니다. 우리는 재무 분석, 비즈니스 의사 결정 및 의료 과학에 관한 수백 가지의 퍼즐과 계산 문제를 해결했습니다. 우리는 삶을 편하게 하고 보다 복잡한 연구 분야에서 우리를 돕기 위해 수많은 기계 기반 응용 프로그램과 도구를 사용했습니다. 한편, 우리는 작업 속도와 효율성을 높이기 위해 기계에 자체 지능을 부여했습니다. 우리의 삶은 AI와 머신 러닝에 크게 의존하기 때문에 그것이 우리를 능가하는 것은 시간 문제였습니다.
CAPTCHA가 더 나아갈 수 있는 길이는 얼마입니까?
연구원들이 이 응답-챌린지 메커니즘에 대해 연구하고 있는 바에 따르면 이것은 시작에 불과합니다. 현재 CAPTCHA 도구를 업그레이드하고 이러한 응답 챌린지 테스트가 수행되는 방식을 변경하기 위한 다양한 테스트가 있었습니다. 2017년 PayPal은 새로운 종류의 CAPTCHA 기술에 대한 특허를 획득했습니다. 여기에서 사용자가 자신의 인간성을 증명하기 위해 묻는 퍼즐과 질문은 민족, 위치, 성별에 따라 다릅니다. 마찬가지로 Amazon Technologies는 사람들에게 익숙하지 않은 착시 현상과 일반적인 논리 퍼즐을 풀어야 하는 CAPTCHA 퍼즐 스타일에 대한 특허를 받았습니다. 이제 아마존은 퍼즐을 뒤집으려 했습니다. Amazon Technologies는 대부분의 인간이 그러한 응답을 잘못 받을 것이라고 주장했지만, 현대의 AI는 능력을 감안할 때 올바른 응답을 할 것이므로 잘못된 응답으로 응답하는 것은 인간 사용자가 될 것입니다. 다른 특허에는 사용자가 자신의 인간성을 증명하기 위해 보드 퍼즐 종류의 이미지를 풀어야 하는 CAPTCHA용 게임 같은 퍼즐이 포함됩니다. 다음은 CAPTCHA를 업데이트하기 위한 초기 아이디어 중 일부입니다.
하지만, 정말 효과적입니까?
많은 면에서 그렇지 않습니다. 첫째, 기계 학습이 문자 그대로 인간 진화의 다음 단계인 이 "우주 시대" 세대에서 보안 문자는 깨지지 않은 채로 남아 있을 것입니다. -둘째, 이러한 아이디어는 인간에게 너무 복잡합니다. 남자가 문화적으로 다양한 질문에 항상 올바르게 대답할 것으로 기대한다면 그것은 잘못된 것입니다. 사람들은 인종, 언어 및 성격이 매우 큰 규모로 서로 다르며 문화적 배경을 기반으로 이러한 광범위한 대응 과제를 개발하는 것은 거의 불가능합니다. 또한 인터넷은 IQ, 나이, 지능 수준에 관계없이 어디서나 누구나 접근할 수 있는 것입니다. 따라서 모든 연령대의 모든 사람이 웹 페이지를 통과하기 위해 보드 게임 퍼즐을 풀 수 있다고 믿기 어렵습니다. 아마도 연구원들은 기계 간섭에 대한 저항을 유지하기 위해 인간이 어떤 존재인지 잊어버리고 최근 개발에서 그 요소를 제거했을 것입니다.
CAPTCHA의 신뢰성을 높이려면 어떻게 해야 하나요?
글쎄, 그것은 우리가 인간을 위해 이것을 더 쉽게 만들 수 있는 무언가를 생각해내기 전에 훌륭한 토론과 연구의 주제입니다. However, there is a need to look for some aspect of human behavior that may be impossible for an AI bot to mimic. More focus can be diverted to developing CAPTCHA tools that would look for webpage “actions”. Google recently activated its Version 3 of reCAPTCHA called reCAPTCHA v3. The new version of the response-challenge test by Google use what’s called “Adaptive Risk Analysis”, which do not push users to any sort of test and don’t ask them for ticking up the virtual box. It’s completely friction-free for users and allows them to access webpages directly. To carry out bot detection for preventing spam abuse, Google’s new reCAPTCHA would allow website owners to determine whether their site users are a bot or not, via scores that Google would give them based on its risk analysis algorithm. The score would detect if the traffic on the site is suspicious or not. Owners can then present suspicious users with a response test to cross-check reCAPTCHA’s detection. While Google won’t tell how their new algorithm would assign these scores to users, it can be considered as a welcoming medium of filtering traffic, where users’ annoyance and difficulty to solve the earlier tests has been considered.
Final Opinion
It’s too early to say that Google’s new reCAPTCHA v3 is the best and most user-friendly way to avoid bot traffic on webpages. Moreover, the pace at which AI and machine learning research are moving ahead, we cannot know of implications that would have on any new CAPTCHA technique.
Since people are putting more stakes at machine learning and not on surveillance on machine activities, all these new patents of CAPTCHA techniques may become non-viable in the near future. For now, CAPTCHA remains the most widely used response-challenge test for bot detection on the web. But to have it that way for more and more years, it is important that methods of the distinction between AI and humans are discovered before we pass on everything we have and whatever defines our legacy to the smart machines we are being dependent on.