AI Agent mới thử nghiệm của Google có thể duyệt web giúp bạn

bởi stevenlam

Gần đây, Google đã giới thiệu Gemini 2.0, thế hệ tiếp theo của bộ công cụ GenAI. Công ty đang dần đưa ra nhiều đại lý GenAI khác nhau để tận dụng mô hình mới cho các nhiệm vụ khác nhau.

Một trong số đó, Mariner, có khả năng tự động điều khiển trình duyệt web để thu thập thông tin, thực hiện giao dịch và các hành động khác.

Google đã bắt đầu thử nghiệm sớm một đại lý AI mới có thể tự động hóa các nhiệm vụ duyệt web. Mặc dù công ty thừa nhận rằng phần mềm chưa hoàn hảo và đang thực hiện các biện pháp an toàn, việc triển khai nó có thể đặt ra câu hỏi về tương lai của internet.

Dự án Mariner, là một tiện ích mở rộng cho phiên bản thử nghiệm của Chrome, có thể thực hiện các lệnh đa bước để duyệt các trang web, sử dụng tìm kiếm của Google, thu thập thông tin cụ thể, mua sắm và nhiều hơn nữa. Công ty khẳng định rằng đại lý này có thể hỗ trợ trong những nhiệm vụ thường tốn thời gian cho con người.

Trong một ví dụ, một người kiểm tra đã yêu cầu Mariner tìm địa chỉ email liên lạc của nhiều công ty được liệt kê trong bảng tính. Mariner sau đó tiến hành tìm kiếm trên Google trang web chính thức của từng công ty, duyệt qua các trang web đó, sao chép địa chỉ email liên lạc và dán vào cửa sổ trò chuyện.

Một minh chứng khác yêu cầu tác nhân xác định họa sĩ ấn tượng nổi tiếng nhất, thu thập một số tác phẩm của họ và thêm những bức tranh tương tự vào giỏ hàng của người dùng trên Etsy. Đáp lại, nó trình bày một số bức tranh của Vincent Van Gogh và dừng lại ngay trước khi mua một bộ màu trên trang nghệ thuật.

Để đảm bảo tính minh bạch, Mariner hiển thị toàn bộ chuỗi logic của nó trong cửa sổ trò chuyện ở bên phải của cửa sổ trình duyệt. Người dùng có thể tạm dừng tác nhân bất kỳ lúc nào và có quyền quyết định cuối cùng trước khi nó hoàn tất các giao dịch mua. Hơn nữa, AI chỉ kiểm soát tab đang hoạt động của cửa sổ trình duyệt.

Google thừa nhận rằng Mariner không nhanh chóng và chính xác tuyệt đối, do đó thời điểm phát hành công khai vẫn chưa rõ ràng. Tìm kiếm Van Gogh mất khoảng năm phút, và công ty đã phải tăng tốc độ video minh họa việc lấy email liên hệ.

Mariner có khả năng là phiên bản thử nghiệm cho Dự án Jarvis, một tác nhân AI mà The Information đã tiết lộ vào tháng Mười. Báo cáo cho thấy Jarvis có thể nhập văn bản, chụp ảnh màn hình, diễn giải thông tin và điều khiển con trỏ chuột.

Đáng chú ý, Mariner giống với ý tưởng mà CEO AI của Microsoft, Mustafa Suleyman, gần đây đã đề xuất. Ông tin rằng các trợ lý AI có thể làm cho việc duyệt web thủ công trở nên lỗi thời trong vài năm tới và rằng các trang web có thể được thiết kế lại để các tác nhân AI đại diện cho doanh nghiệp có thể giao tiếp với các tác nhân AI đại diện cho khách hàng.

Những công cụ mới trong Gemini 2.0 có thể mô tả các đối tượng trong thế giới thực bằng nhiều ngôn ngữ khác nhau, hỗ trợ các nhà phát triển và tư vấn cho người dùng trong quá trình chơi trò chơi điện tử.

Theo Techspot

5 1 đánh giá
Đánh giá bài viết

Bài viết liên quan

Theo dõi
Thông báo của
guest

0 Góp ý
Cũ nhất
Mới nhất Được bỏ phiếu nhiều nhất
Phản hồi nội tuyến
Xem tất cả bình luận
0
Rất thích suy nghĩ của bạn, hãy bình luận.x