AI vừa đạt trình độ con người ở một bài kiểm tra quan trọng

bởi stevenlam

Hệ thống AI đã hoàn thành việc vượt qua 100% CAPTCHA. Thông số này cho thấy AI đã tiến bộ đến mức có khả năng tương đương với con người trong việc giải mã CAPTCHA.

Chắc hẳn bạn đã biết đến các bài kiểm tra CAPTCHA – những ô hình ảnh yêu cầu người dùng nhận diện các đối tượng như đèn tín hiệu giao thông, xe đạp hoặc vạch kẻ đường. Thực tế, chúng ta đã trở nên quen thuộc với việc phải chứng minh mình là con người khi truy cập internet.

Bức tường thành CAPTCHA bị phá vỡ

CAPTCHA là từ viết tắt của “Completely Automated Public Turing test to tell Computers and Humans Apart,” nghĩa là bài kiểm tra Turing công khai và tự động nhằm phân biệt máy tính với con người. Công cụ này thường được coi là lớp bảo vệ cho các trang web trước sự tấn công từ phần mềm tự động.

Tuy nhiên, một nghiên cứu gần đây đã chỉ ra rằng các bot sử dụng trí tuệ nhân tạo có khả năng vượt qua thử thách này với tỷ lệ thành công là 100%. Con số này cho thấy rằng trí tuệ nhân tạo (AI) đã phát triển đến mức có thể cạnh tranh ngang hàng với con người trong việc giải mã CAPTCHA.

Cụ thể, theo thông tin từ Andreas Plesner, một nghiên cứu sinh tiến sĩ tại ETH Zurich, nghiên cứu của họ tập trung vào hệ thống CAPTCHA nổi tiếng của Google, đó là ReCAPTCHA v2. Hệ thống này yêu cầu người dùng nhận diện các đối tượng quen thuộc trong hình ảnh như đèn giao thông, xe đạp hoặc bậc thang.

Các CAPTCHA xác định hình ảnh thường gặp. Ảnh: Arxiv.

Các CAPTCHA xác định hình ảnh thường gặp. Ảnh: Arxiv.

Theo Ars Technica, Google đã bắt đầu loại bỏ dần hệ thống ReCAPTCHA cũ để chuyển sang phiên bản ReCAPTCHA v3 “vô hình”, tập trung vào việc phân tích tương tác của người dùng.

Tuy nhiên, ReCAPTCHA v2 vẫn được hàng triệu trang web sử dụng. Ngay cả những trang web áp dụng ReCAPTCHA v3 cũng sẽ quay lại sử dụng CAPTCHA hình ảnh truyền thống nếu hệ thống phát hiện người dùng có dấu hiệu không đáng tin cậy.

Để phát triển một bot vượt qua ReCAPTCHA v2, Plesner và nhóm nghiên cứu đã tận dụng mô hình nhận diện đối tượng YOLO (You Only Look Once).

Mô hình YOLO này từng được ứng dụng trong các bot gian lận trò chơi nhờ khả năng phát hiện vật thể theo thời gian thực. YOLO hoạt động hiệu quả trên những thiết bị có khả năng tính toán hạn chế, giúp thực hiện các cuộc tấn công quy mô lớn.

Sau khi huấn luyện mô hình với 14.000 hình ảnh đã được gán nhãn, hệ thống có thể xác định xác suất một hình ảnh CAPTCHA thuộc về một trong 13 loại đối tượng mà ReCAPTCHA yêu cầu người dùng nhận diện.

Để xử lý các loại CAPTCHA yêu cầu chọn những phần nhất định trong hình ảnh, nhóm đã sử dụng một mô hình YOLO khác được huấn luyện riêng biệt. Mô hình này chỉ hoạt động hiệu quả với 9/13 danh mục. Tuy nhiên, trong trường hợp gặp hình ảnh khó nhận diện, bot có thể yêu cầu hệ thống cung cấp hình ảnh mới.

“Kỷ nguyên hậu CAPTCHA”

Kết quả cho thấy mô hình YOLO có khả năng nhận diện hình ảnh CAPTCHA với độ chính xác từ 69% (đối với hình ảnh xe máy) đến 100% (đối với trụ nước cứu hỏa).

Khi kết hợp với các biện pháp bổ sung như sử dụng VPN để né tránh bị phát hiện, di chuột giả để tái tạo hành vi của con người và khai thác thông tin cookie từ các phiên duyệt web thật, bot này đã vượt qua CAPTCHA trong mọi lần thử nghiệm.

Trong nhiều tình huống, bot thậm chí còn giải mã CAPTCHA nhanh hơn so với con người.

Trước đây, các mô hình nhận diện hình ảnh chỉ đạt được tỷ lệ thành công từ 68-71%. Tuy nhiên, nhờ sự phát triển mạnh mẽ của trí tuệ nhân tạo, việc đạt tỷ lệ thành công 100% giờ đây trở nên hoàn toàn khả thi. “Chúng ta đang bước vào kỷ nguyên hậu CAPTCHA”, nhóm tác giả đã nhận xét trong bài viết khoa học.

Mức độ chính xác của mô hình YOLO khi giải các CAPTCHA hình ảnh khác nhau. Ảnh: Arxiv.

Mức độ chính xác của mô hình YOLO khi giải các CAPTCHA hình ảnh khác nhau. Ảnh: Arxiv.

Theo Ars Technica, CAPTCHA không còn là công nghệ mới mẻ trong việc phân biệt giữa người dùng thật và bot. Kể từ năm 2008, các nhà nghiên cứu đã chỉ ra rằng bot có thể được đào tạo để vượt qua CAPTCHA âm thanh dành cho người khiếm thị.

Đến năm 2017, các mạng nơ-ron nhân tạo đã có khả năng vượt qua những CAPTCHA văn bản yêu cầu người dùng nhập ký tự từ các phông chữ rối rắm. Với những tiến bộ trong trí tuệ nhân tạo, CAPTCHA dần trở nên kém hiệu quả trước các mô hình học máy.

Theo phát ngôn viên của Google Cloud, “Chúng tôi tập trung vào việc hỗ trợ khách hàng bảo vệ người dùng mà không cần hiển thị các câu đố hình ảnh. Đó là lý do chúng tôi đã giới thiệu ReCAPTCHA v3 vào năm 2018. Hiện tại, phần lớn hệ thống bảo mật của ReCAPTCHA trên hơn 7 triệu trang web toàn cầu đều hoạt động hoàn toàn vô hình”.

Tuy nhiên, sự phát triển không ngừng của AI đang giúp nó thực hiện những nhiệm vụ mà trước đây chỉ con người mới có thể làm. Điều này khiến việc xác định xem người dùng trình duyệt có phải là con người hay không trở nên khó khăn hơn. Nhóm tác giả nhận định: “Ở một khía cạnh nào đó, một CAPTCHA tốt chính là ranh giới phân biệt giữa cỗ máy thông minh nhất và con người kém thông minh nhất”.

Theo ZNews

0 0 đánh giá
Đánh giá bài viết

Bài viết liên quan

Theo dõi
Thông báo của
guest

0 Góp ý
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận
0
Rất thích suy nghĩ của bạn, hãy bình luận.x