Auto-GPT là gì mà ‘ra dẻ’ quá vậy?


Nhiệm vụ tự động hóa mọi thứ của Thung lũng Silicon không ngừng tiếp diễn, điều này giải thích nỗi ám ảnh mới nhất của nó: Auto-GPT.





Về bản chất, Auto-GPT sử dụng tính linh hoạt của các mô hình AI mới nhất của OpenAI để tương tác với phần mềm và dịch vụ trực tuyến, cho phép nó “tự động” thực hiện các tác vụ như X và Y.





Auto-GPT
Auto-GPT




Nhưng khi chúng ta đang học với các mô hình ngôn ngữ lớn, khả năng này dường như bao la như đại dương nhưng sâu thì như vũng nước.





Auto-GPT là một ứng dụng nguồn mở được tạo bởi nhà phát triển trò chơi Toran Bruce Richards, sử dụng các mô hình tạo văn bản của OpenAI, chủ yếu là GPT-3.5 và GPT-4, để hành động “tự chủ”.





Không có gì bí ẩn trong sự tự chủ đó.





Auto-GPT chỉ đơn giản là xử lý các bước tiếp theo đối với prompt (lời nhắc) ban đầu của các mô hình OpenAI, cả hỏi và trả lời chúng cho đến khi hoàn thành nhiệm vụ.





Về cơ bản, Auto-GPT là GPT-3.5 và GPT-4 được ghép nối với một bot đồng hành hướng dẫn GPT-3.5 và GPT-4 phải làm gì.





Người dùng cho Auto-GPT biết mục tiêu của họ là gì và đến lượt bot, sử dụng GPT-3.5 và GPT-4 cùng một số chương trình để thực hiện mọi bước cần thiết nhằm đạt được bất kỳ mục tiêu nào họ thiết lập.





Điều làm cho Auto-GPT có năng lực thực hiện là khả năng tương tác với các ứng dụng, phần mềm và dịch vụ cả trực tuyến và cục bộ, như trình duyệt web và trình xử lý văn bản.





Ví dụ: đưa ra prompt như “hãy giúp tôi phát triển công việc kinh doanh hoa của mình”, Auto-GPT có thể phát triển một chiến lược quảng cáo tương đối hợp lý và xây dựng một trang web cơ bản.











Joe Koen, nhà phát triển phần mềm (software developer) đã thử qua Auto-GPT, giải thích Auto-GPT về cơ bản tự động hóa các dự án nhiều bước yêu cầu tạo prompt qua lại với mô hình AI định hướng chatbot như ChatGPT của OpenAI.





Koen cho biết:





“Auto-GPT xác định một tác tử (agent) giao tiếp với API của OpenAI. Mục tiêu của tác tử này là thực hiện nhiều lệnh khác nhau mà AI tạo ra để đáp ứng các yêu cầu của tác agent. Người dùng được nhắc nhập thông tin để chỉ định vai trò và mục tiêu của AI trước khi agent bắt đầu thực hiện các lệnh.”





Trong một thiết bị đầu cuối, người dùng mô tả tên, vai trò và mục tiêu của tác tử Auto-GPT, đồng thời chỉ định tối đa năm cách để đạt được mục tiêu đó. Ví dụ:





  • Tên: Điện thoại thông minh-GPT
  • Vai trò: Một AI được thiết kế để tìm ra chiếc điện thoại thông minh tốt nhất
  • Mục tiêu: Tìm điện thoại thông minh tốt nhất trên thị trường
  • Mục tiêu 1: Thực hiện nghiên cứu thị trường cho các loại điện thoại thông minh khác nhau trên thị trường hiện nay
  • Mục tiêu 2: Lấy năm điện thoại thông minh hàng đầu và liệt kê ưu và nhược điểm của chúng




Ở hậu trường, Auto-GPT dựa vào các tính năng như quản lý bộ nhớ để thực thi các tác vụ, cùng với GPT-4 và GPT-3.5 để tạo văn bản, lưu trữ tệp và tóm tắt.





Auto-GPT cũng có thể được kết nối với các bộ tổng hợp giọng nói, chẳng hạn như ElevenLabs, để nó có thể “thực hiện” các cuộc gọi điện thoại chẳng hạn.





Auto-GPT có sẵn công khai trên GitHub, nhưng nó yêu cầu một số thiết lập và bí quyết để thiết lập và chạy.





Để sử dụng nó, Auto-GPT phải được cài đặt trong môi trường phát triển như Docker và nó phải được đăng ký bằng khóa API từ OpenAI — yêu cầu phải có tài khoản OpenAI trả phí.





Nó có thể đáng giá – mặc dù đa phần không đồng tình với điều đó. Những người dùng đầu tiên đã sử dụng Auto-GPT để đảm nhận các loại nhiệm vụ thông thường được ủy quyền tốt hơn cho bot.





Ví dụ: Auto-GPT có thể điền các mục như mã gỡ lỗi và viết email hoặc những thứ nâng cao hơn, chẳng hạn như tạo kế hoạch kinh doanh cho một công ty khởi nghiệp mới.





Adnan Masood, kiến trúc sư trưởng tại UST, một công ty tư vấn công nghệ, cho biết:





“Nếu Auto-GPT gặp bất kỳ trở ngại nào hoặc không thể hoàn thành nhiệm vụ, nó sẽ phát triển các prompt mới để giúp nó điều hướng tình huống và xác định các bước tiếp theo phù hợp.

Các mô hình ngôn ngữ lớn vượt trội trong việc tạo ra phản hồi giống như con người, nhưng vẫn dựa vào lời nhắc và tương tác của người dùng để mang lại kết quả mong muốn. Ngược lại, Auto-GPT tận dụng các khả năng nâng cao của API của OpenAI để hoạt động độc lập mà không cần sự can thiệp của người dùng.”





Trong những tuần gần đây, các ứng dụng mới đã xuất hiện để giúp Auto-GPT dễ sử dụng hơn, như AgentGPT và GodMode, cung cấp một giao diện đơn giản nơi người dùng có thể nhập những gì họ muốn thực hiện trực tiếp trên trang trình duyệt.





Lưu ý rằng, giống như Agent-GPT, cả hai đều yêu cầu khóa API từ OpenAI để mở khóa toàn bộ khả năng của chúng.





Tuy nhiên, giống như bất kỳ công cụ mạnh mẽ nào, Auto-GPT có những hạn chế — và rủi ro.











Tùy thuộc vào mục tiêu mà công cụ cung cấp, Auto-GPT có thể hoạt động theo những cách rất… bất ngờ.





Một người dùng Reddit tuyên bố rằng, với ngân sách 100 đô la để chi tiêu trong một phiên bản máy chủ, Auto-GPT đã tạo một trang wiki về mèo, khai thác một lỗ hổng trong phiên bản này để giành quyền truy cập cấp quản trị viên và chiếm lấy môi trường Python mà nó được tạo ra đang chạy – và sau đó “giết chết” chính nó.





Ngoài ra còn có ChaosGPT, một phiên bản sửa đổi của Auto-GPT được giao nhiệm vụ với các mục tiêu như “tiêu diệt loài người” và “thiết lập sự thống trị toàn cầu”. Không có gì đáng ngạc nhiên, ChaosGPT đã không tiến gần đến việc mang đến ngày tận thế cho người máy — nhưng nó đã tweet khá không hay về loài người.





ChaosGPT được thiết lập để tiêu diệt loài người
ChaosGPT được thiết lập để tiêu diệt loài người




Tuy nhiên, có thể cho rằng nguy hiểm hơn Auto-GPT khi cố gắng “tiêu diệt loài người” là những vấn đề không lường trước được có thể nảy sinh trong các tình huống hoàn toàn bình thường. Bởi vì nó được xây dựng trên các mô hình ngôn ngữ của OpenAI — các mô hình, giống như tất cả các mô hình ngôn ngữ, có xu hướng không chính xác — nên nó có thể mắc lỗi.





Đó không phải là vấn đề duy nhất.





Sau khi hoàn thành thành công một tác vụ, Auto-GPT thường không nhớ cách thực hiện tác vụ đó để sử dụng sau này và — ngay cả khi có — nó thường không nhớ để sử dụng chương trình.





Auto-GPT cũng gặp khó khăn trong việc chia nhỏ các nhiệm vụ phức tạp thành các nhiệm vụ phụ đơn giản hơn một cách hiệu quả và gặp khó khăn trong việc hiểu các mục tiêu khác nhau trùng lặp như thế nào.





Clara Shih, Giám đốc điều hành Đám mây Dịch vụ của Salesforce và là một người đam mê Auto-GPT, cho biết:





“Auto-GPT minh họa sức mạnh và những rủi ro chưa biết của AI tổng quát. Đối với các doanh nghiệp, điều đặc biệt quan trọng là phải đưa con người vào phương pháp tiếp cận vòng lặp khi phát triển và sử dụng các công nghệ AI tổng quát như Auto-GPT.”





GAMBA Team. Nguồn: TechCrunch.