📢 #Gate观点任务# 第九十期精彩啟程!調研 Pell Network (PELL) 項目,在Gate.io動態發佈您的看法觀點,瓜分 $100 GT!
💰️ 選取10名優質發帖用戶,每人輕鬆贏取 $10 GT 獎勵,獲獎文章還將被標記為“精選”!
👉 參與方式:
調研$PELL項目,發表你對項目的見解。
帶上$PELL現貨交易鏈接:https://www.gate.io/trade/PELL_USDT
推廣$PELL Launchpool挖礦活動,質押$BTC、$PELL、$GT參與瓜分7,002,801 $PELL挖礦獎勵:https://www.gate.io/launchpool/PELL?pid=237
推廣$PELL上線狂歡活動,充值、交易、註冊享三重福利,參與瓜分$30,000 PELL獎勵:https://www.gate.io/announcements/article/43851
建議創作的主題方向:
🔹 什麼是 Pell Network?
🔹 Pell Network 在BTC再質押方面有什麼優勢?
🔹 $PELL 代幣經濟模型是如何運作的?
您可以選擇以上一個或多個方向發表看法,也可以跳出框架,分享主題以外的獨到見解。
注意:帖子不得包含除 #Gate观点任务# 和 #PELL# 之外的其他標籤,並確保你的帖子至少有 60 字,並獲得至少 3
AI自主智能體大盤點,構建、應用、評估全覆蓋,人大高瓴文繼榮等32頁綜述
**編輯:**杜偉、陳萍
在當今的AI 時代,自主智能體被認為是通向通用人工智能(AGI)的一條有前途的道路。所謂自主智能體,即能夠通過自主規劃和指令來完成任務。在早期的開發範式中,決定智能體行動的策略功能是以啟發式為主的,並在環境交互中逐步得到完善。
不過,在不受約束的開放域環境中,自主智能體的行動往往很難企及人類水平的熟練程度。
隨著近年來大語言模型(LLM)取得了巨大成功,並展現出了實現類人智能的潛力。因而得益於強大的能力,LLM 越來越多地被用作創建自主智能體的核心協調者,並先後出現花樣繁多的AI 智能體。這些智能體通過模仿類人的決策過程,為更複雜和適應性更強的AI 系統提供了一條可行性路徑。
在現階段,對已經出現的基於LLM 的自主智能體進行整體分析非常重要,並對全面了解該領域的發展現狀以及啟發未來的研究具有重要意義。
本文中,來自中國人民大學高瓴人工智能學院的研究者對基於LLM 的自主智能體展開了全面調研,並著眼於它們的構建、應用和評估三個方面。
對於智能體的構建,他們提出了一個由四部分組成的統一框架,分別是表示智能體屬性的配置模塊、存儲歷史信息的記憶模塊、制定未來行動策略的規劃模塊和執行規劃決定的行動模塊。在介紹了典型的智能體模塊之後,研究者還總結了常用的微調策略,通過這些策略來增強智能體對不同應用場景的適應性。
接下來研究者概述了自主智能體的潛在應用,探討它們如何對社會科學、自然科學和工程學領域產生增益。最後討論了自主智能體的評估方法,包括主觀和客觀評估策略。下圖為文章整體架構。
基於LLM 的自主智能體構建
為了讓基於LLM 的自主智能體更加高效,有兩個方面需要考慮:首先是應該設計怎樣的架構使得智能體能更好的利用LLM;其次是如何有效地學習參數。
智能體架構設計:本文提出了一個統一的框架來總結之前研究中提出的架構,整體結構如圖2 所示,它由分析(profiling)模塊、記憶模塊、規劃模塊以及動作模塊組成。
分析模塊
自主智能體通過特定角色來執行任務,例如程序員、教師和領域專家。分析模塊旨在表明智能體的角色是什麼,這些信息通常被寫入輸入提示中以影響LLM 行為。在現有的工作中,有三種常用的策略來生成智能體配置文件:手工製作方法;LLM-generation 方法;數據集對齊方法。
記憶模塊
記憶模塊在AI 智能體的構建中起著非常重要的作用。它記憶從環境中感知到的信息,並利用記錄的記憶來促進智能體未來的動作。記憶模塊可以幫助智能體積累經驗、實現自我進化,並以更加一致、合理、有效的方式完成任務。
規劃模塊
當人類面臨複雜任務時,他們首先將其分解為簡單的子任務,然後逐一解決每個子任務。規劃模塊賦予基於LLM 的智能體解決複雜任務時需要的思考和規劃能力,使智能體更加全面、強大、可靠。本文介紹了兩種規劃模塊:沒有反饋的規劃以及有反饋的規劃。
動作模塊
動作模塊旨在將智能體的決策轉化為具體的結果輸出。它直接與環境交互,決定智能體完成任務的有效性。本節從動作目標、策略、動作空間和動作影響來介紹。
除了上述4 個部分外,本章還介紹了智能體的學習策略,包括從示例中學習、從環境反饋中學習、從交互的人類反饋中學習。
表1 列出了之前的工作和本文的分類法之間的對應關係:
本章探討了基於LLM 的自主智能體在三個不同領域的變革性影響:社會科學、自然科學和工程。
又比如在計算機科學和軟件工程領域,基於LLM 的智能體提供了自動化編碼、測試、調試和文檔生成的潛力。有研究者提出了ChatDev ,這是一個端到端的框架,其中多個智能體通過自然語言對話進行溝通和協作,以完成軟件開發生命週期;ToolBench 可以用於代碼自動補全和代碼推薦等任務; MetaGPT 可以扮演產品經理、架構師、項目經理和工程師等角色,內部監督代碼生成並提高最終輸出代碼的質量等等。
下表為基於LLM 的自主智能體的代表性應用:
本文介紹了兩種常用的評估策略:主觀評估和客觀評估。
主觀評估是指人類通過交互、評分等多種手段對基於LLM 的智能體的能力進行測試。在這種情況下,參與評估的人員往往是通過眾包平台招募的;而一些研究者認為眾包人員由於個體能力差異而不穩定,因而也會使用專家註釋來進行評估。
除此以外,在當前的一些研究中,我們可以使用LLM 智能體作為主觀評估者。例如在ChemCrow 研究中,uatorGPT 通過指定等級來評估實驗結果,該等級既考慮任務的成功完成,又考慮基本思維過程的準確性。又比如Chat 組建了一個基於LLM 的多智能體裁判小組,通過辯論來評估模型的生成結果。
與主觀評估相比,客觀評估具有多種優勢,客觀評估是指使用定量指標來評估基於LLM 自主智能體的能力。本節從指標、策略和基準的角度回顧和綜合客觀評估方法。
在使用評估過程中,我們可以將這兩種方法結合使用。
表3 總結了以前的工作與這些評估策略之間的對應關係: