"AI Agent" Và "AI Assistant" Có Khác Nhau Không?

Mục lục

Vào cuối năm 2022, khi ChatGPT được ra mắt chính thức, các chuyên gia trong lĩnh vực phát triển trí tuệ nhân tạo đều bàn luận về một thế hệ mới của trợ lý ảo, kết hợp khả năng hiện có với tính năng tạo ra ngôn ngữ tự nhiên. Tuy nhiên, trong khoảng thời gian gần đây, sự quan tâm của ngành công nghệ đã dồn vào một sản phẩm và mục tiêu mới: Nhân sự AI, hay còn gọi là AI agent.

Tại sự kiện Google I/O diễn ra vào tháng 5, AI agent đã trở thành trung tâm của sự kiện. Google đã giới thiệu một AI agent mang tên Astra, cho phép người dùng tương tác thông qua giọng nói và hình ảnh từ thiết bị công nghệ. Ngoài ra, GPT-4o cũng được xem như một AI agent khác.

Khái niệm AI agent không chỉ đơn thuần là một chiến lược marketing để thu hút sự chú ý, mà các tập đoàn công nghệ đang đầu tư hàng tỷ USD vào việc phát triển chúng. Công cụ AI này có tiềm năng lớn và có thể trở thành công cụ hữu ích mà con người và ngành công nghệ đã mong đợi từ lâu.

Tuy nhiên, nhân sự AI khác biệt như thế nào so với trợ lý AI? Và làm thế nào chúng ta có thể tận dụng những công cụ này?

AI Agent là gì?

Hiện nay, việc nghiên cứu và phát triển AI agent vẫn đang trong giai đoạn mới mẻ, và ngành công nghệ chưa có định nghĩa chung để mô tả các công cụ hỗ trợ con người này. Tuy nhiên, đơn giản, AI agent là các mô hình và thuật toán AI có khả năng tự động ra quyết định trong thế giới thực. Đây là quan điểm của tiến sĩ và nhà nghiên cứu hàng đầu Jim Fan, người đứng đầu trong việc phát triển AI agent tại Nvidia.

Tầm nhìn cho ngành phát triển AI agent là tạo ra các thuật toán và ứng dụng có thể thực hiện nhiều công việc và nhiệm vụ, tương tự như một trợ lý con người. Trong tương lai, AI agent có thể hỗ trợ đặt vé máy bay hoặc phòng khách sạn, và có khả năng ghi nhớ sở thích của người dùng để tự động đặt phòng khách sạn phù hợp với giá cả và chất lượng.

Đồng thời, AI agent cũng có thể chọn lựa ngày giờ bay phù hợp với lịch trình của người dùng, và lập kế hoạch ăn uống trong chuyến đi dựa trên sở thích cá nhân. Nó cũng có thể gợi ý những vật dụng cần mang theo trong hành lý, dự báo thời tiết để chuẩn bị kế hoạch đi lại tốt nhất. Thậm chí, nếu người dùng có bạn bè hoặc người thân ở địa điểm sắp đến, AI agent sẽ tự động chia sẻ lịch trình và mời họ tham gia các hoạt động.

Tại nơi làm việc, AI agent có thể phân tích danh sách công việc cần thực hiện và thực hiện chúng, bao gồm việc tự động gửi thông tin cuộc họp, tin nhắn hoặc email dựa trên yêu cầu trước đó của người dùng.Một hướng phát triển của AI agent là đa chế độ, tức là công cụ AI có khả năng xử lý ngôn ngữ, hình ảnh và video. Ví dụ, trong bản demo Google Astra, người dùng có thể sử dụng camera trên điện thoại thông minh để nhận diện các sản phẩm và đặt câu hỏi cho Astra liên quan đến chúng. Sau đó, công cụ AI này có thể trả lời các yêu cầu với dữ liệu đầu vào từ văn bản, âm thanh và video.

Các nhân sự AI này có thể giúp việc kinh doanh và vận hành doanh nghiệp trở nên dễ dàng hơn, theo David Barber, giám đốc trung tâm AI tại Đại học London. Ví dụ, một AI agent có thể hoạt động như một chatbot hỗ trợ khách hàng, nhưng khả năng của nó sẽ phức tạp và sâu hơn nhiều so với các trợ lý ảo hiện tại.

Theo ông Barber, trợ lý ảo AI hiện tại dựa vào mô hình ngôn ngữ chỉ có khả năng tạo ra chuỗi văn bản dựa trên xác suất. Trong khi đó, AI agent cần có khả năng xử lý tự động các câu lệnh ngôn ngữ tự nhiên, thực hiện các tác vụ hỗ trợ khách hàng mà không cần sự can thiệp của con người.

Ví dụ, AI agent cần có khả năng phân tích các phàn nàn trong email của khách hàng, kiểm tra thông tin từ cơ sở dữ liệu quản lý quan hệ khách hàng và hệ thống phân phối hàng hóa để xử lý các vấn đề theo quy trình của doanh nghiệp.

Theo Tiến sĩ Fan của Nvidia, có hai loại AI agent chính: nhân sự phần mềm và nhân sự AI có hình thù.Các nhân sự phần mềm chạy trên các thiết bị điện tử như máy tính, máy chủ hoặc điện thoại thông minh của người dùng thông qua ứng dụng, ví dụ như trợ lý ảo hỗ trợ lên lịch trình du lịch. Những trợ lý AI này rất hữu ích trong công việc văn phòng, gửi email và xử lý các chuỗi công việc có thứ tự.

Trong khi đó, AI có hình thù có thể xuất hiện dưới dạng mô hình đồ họa trong thế giới ảo 3D hoặc dưới hình thức robot thực tế, không chỉ hiển thị theo cách trừu tượng trong ứng dụng máy tính và điện thoại thông minh.

Các AI agent có hình thù cụ thể mà con người có thể nhìn thấy có thể làm cho trò chơi điện tử hấp dẫn hơn, cho phép người chơi tương tác với những nhân vật máy được điều khiển bởi AI. Trong thế giới thực, các AI agent áp dụng cho tự động hóa có thể tạo ra các robot hữu ích hơn, hỗ trợ con người trong cuộc sống hàng ngày, đặc biệt là trong việc chăm sóc người tàn tật và người cao tuổi.

Tiến sĩ Fan là một trong những nhà nghiên cứu đã phát triển MineDojo, một AI agent hoạt động trong trò chơi Minecraft. Sử dụng dữ liệu lớn thu thập từ internet, AI agent của Tiến sĩ Fan và đồng nghiệp có khả năng học hỏi kỹ năng mới để thực hiện các nhiệm vụ khám phá thế giới ảo, thậm chí thực hiện các nhiệm vụ phức tạp như xây hàng rào để bao vây lạc đà trong trò chơi hoặc thu hoạch nham trong game. Phát triển AI agent thông qua trò chơi điện tử là bởi vì trò chơi đã cung cấp mã nguồn mô phỏng vật lý để AI học và hiểu quy luật vật lý, cũng như kỹ năng phân tích và logic.Trong báo cáo nghiên cứu mới, các chuyên gia tại trường đại học Princeton đã chỉ ra rằng AI agent thường có ba đặc điểm khác biệt. Đầu tiên, một công cụ AI sẽ được coi là agent thay vì trợ lý nếu chúng có khả năng thực hiện các nhiệm vụ và mục tiêu khác nhau mà không cần sự hướng dẫn trong các môi trường làm việc hoặc cuộc sống phức tạp. Thứ hai, công cụ AI có thể được coi là agent nếu người dùng có thể ra lệnh bằng ngôn ngữ tự nhiên và hoạt động hoàn toàn tự động mà không cần sự kiểm soát từ con người. Cuối cùng, khái niệm agent cũng có thể áp dụng cho các hệ thống machine learning có khả năng sử dụng các công cụ như tìm kiếm trực tuyến hoặc lập trình, và có khả năng lập kế hoạch cho một chuỗi các công việc tuần tự.

AI agent có phải một khái niệm hoàn toàn mới không?

Theo Giáo sư Khoa học Máy tính Chirag Shah tại Đại học Washington, khái niệm AI agent đã tồn tại trong nhiều năm, nhưng mỗi giai đoạn lại mang ý nghĩa khác nhau.

Theo Tiến sĩ Fan, đã có hai xu hướng phát triển nhân sự AI. Xu hướng hiện tại đang phát triển nhanh chóng nhờ vào sự bùng nổ và ứng dụng các mô hình ngôn ngữ lớn, cũng như sự phổ biến của các hệ thống chatbot AI như ChatGPT hay Claude.

Xu hướng trước đó được thiết lập vào năm 2016, khi DeepMind giới thiệu AlphaGo – hệ thống AI chơi cờ vây có khả năng đánh bại kỳ thủ số 1 thế giới Lee Sedol. Theo định nghĩa của các nhà khoa học tại Đại học Princeton, AlphaGo được coi là một AI agent vì khả năng ra quyết định và tính toán chiến lược chơi cờ. Điều này được thực hiện thông qua cơ chế học tăng cường, khuyến khích thuật toán AI học từ phản hồi và hành động của con người.

Oriol Vinyals, Phó Chủ tịch Nghiên cứu tại Google DeepMind, cho biết rằng các công cụ AI không phải là phổ quát. Các AI như AlphaGo được thiết kế với mục đích cụ thể, chỉ phục vụ một lĩnh vực duy nhất, ví dụ như chơi cờ vây. Trong tương lai, thế hệ AI dựa trên mô hình ngôn ngữ có thể giúp AI agent trở nên phổ quát hơn, vì chúng có khả năng học từ thế giới thực, nơi mà con người tương tác với máy móc và với nhau.

Các hạn chế của công nghệ là gì?

Hiện nay, vẫn còn nhiều thách thức cần được giải quyết và trả lời trong lĩnh vực AI. CEO và nhà sáng lập startup nghiên cứu AI Imbue, Kanjun Qiu, đã so sánh tình hình phát triển của AI agent hiện nay với giai đoạn chục năm trước khi ngành công nghệ tập trung vào việc phát triển thuật toán cho xe tự lái. Hiện tại, Imbue đang tập trung vào việc phát triển các mô hình AI có khả năng tư duy logic và lập trình.

Theo Qiu, AI agent hiện nay có khả năng thực hiện nhiều công việc, nhưng vẫn chưa đủ tin cậy và hoàn toàn tự động. Ví dụ, công cụ lập trình có thể tạo ra mã code, nhưng đôi khi có sai sót và không biết cách kiểm tra mã code mà chính nó đã tạo ra. Con người vẫn cần can thiệp liên tục vào quá trình hoạt động của công cụ AI. Đặc biệt, các hệ thống AI hiện nay vẫn chưa có khả năng tư duy logic hoàn chỉnh, điều này là rất quan trọng để các hệ thống machine learning có thể hoạt động hiệu quả trong thế giới thực để phục vụ con người.

Tiến sĩ Fan cho rằng chúng ta vẫn chưa đạt được mục tiêu phát triển một AI agent có thể tự động hóa mọi công việc lặp đi lặp lại hàng ngày. Các hệ thống hiện tại luôn có khả năng gây loạn ngôn và không luôn tuân theo yêu cầu của người dùng một cách chính xác.

Một hạn chế khác là sau một thời gian, AI sẽ không thể theo dõi được danh sách công việc mà chúng đã và cần phải thực hiện. Khái niệm này được gọi là không gian ngữ cảnh, context window, đề cập đến lượng dữ liệu mà một mô hình ngôn ngữ có thể đọc, hiểu, phân tích và xử lý cùng một lúc.Tiến sĩ Fan đã chỉ ra rằng ChatGPT có khả năng lập trình nhưng không hiệu quả khi xử lý code lập trình dài. Tuy nhiên, đối với các lập trình viên, họ có thể dễ dàng theo dõi hàng chục hoặc hàng trăm dòng code trên GitHub mà không gặp khó khăn.

Để giải quyết vấn đề này, Google đã cải thiện không gian ngữ cảnh để mô hình Gemini mới có thể hiểu và xử lý, cho phép người dùng tương tác với chatbot trong thời gian dài hơn trong một phiên làm việc. Mô hình cũng có khả năng ghi nhớ các hoạt động trước đó. Google đang phát triển mô hình AI với không gian ngữ cảnh vô hạn để có khả năng nhớ và hiểu mọi thứ.

Với các AI agent có hình thù như nhân vật ảo trong game hoặc robot, họ đang đối diện với nhiều hạn chế hơn. Hiện nay, thiếu dữ liệu để huấn luyện robot thực hiện các công việc như con người. Các nhà khoa học đang bắt đầu nghiên cứu cách áp dụng AI vào tự động hóa.

Tóm lại, tiềm năng của AI agent hỗ trợ con người trong mọi lĩnh vực hiện đang là mục tiêu phát triển. Quá trình nghiên cứu và phát triển công nghệ machine learning vẫn còn ở giai đoạn đầu, và sẽ mất nhiều năm nữa để máy móc có thể đạt được những gì con người mong muốn.

Các công cụ như ChatGPT hay GPT-4 của OpenAI là sản phẩm thử nghiệm đầu tiên trong việc tạo ra AI agent. Hiện tại, các ứng dụng tốt nhất chỉ có thể thực hiện các tác vụ hẹp như tự động hoá code, hỗ trợ khách hàng hoặc tự động hóa các công việc hàng ngày.Theo Cô Qiu, dù chúng ta đã sở hữu các hệ thống máy tính mạnh mẽ hiện nay, nhưng vẫn cần sự kiểm soát cẩn thận từ con người đối với mọi khía cạnh.

Theo MIT Technology Review

AI agent AI assistant

“AI Agent” và “AI Assistant” có khác nhau không?

AI Agent là gì?

AI agent có phải một khái niệm hoàn toàn mới không?

Các hạn chế của công nghệ là gì?

DELL Precision 7550 Mobile Workstation Hiệu năng cao nhờ CPU kiến trúc Comet Lake-H

Lenovo ThinkPad P1 Gen 7: Thiết kế mới, hiệu suất đỉnh cao

Bài viết liên quan

Đăng bình luận Hủy bỏ bình luận