Gate Booster 第 4 期:發帖瓜分 1,500 $USDT
🔹 發布 TradFi 黃金福袋原創內容,可得 15 $USDT,名額有限先到先得
🔹 本期支持 X、YouTube 發布原創內容
🔹 無需複雜操作,流程清晰透明
🔹 流程:申請成為 Booster → 領取任務 → 發布原創內容 → 回鏈登記 → 等待審核及發獎
📅 任務截止時間:03月20日16:00(UTC+8)
立即領取任務:https://www.gate.com/booster/10028?pid=allPort&ch=KTag1BmC
更多詳情:https://www.gate.com/announcements/article/50203
LangChain 讓 AI 代理能自主掌控自己的記憶管理
Terrill Dicki
2026年3月12日 01:55
LangChain的深度代理SDK現在允許AI模型自行決定何時壓縮其上下文窗口,減少在長時間運行的代理工作流程中的手動干預。
LangChain已發布其深度代理SDK的更新,賦予AI模型自主管理記憶的能力。該新功能於2026年3月11日宣布,允許代理自主觸發上下文壓縮,而非依賴固定的令牌閾值或手動用戶命令。
此變化解決了代理開發中的一個持續難題:上下文窗口在不合時宜的時候填滿。目前的系統通常在接近模型上下文限制的85%時進行記憶壓縮——這可能發生在重構過程中或在複雜的調試會話中。時機不當會導致上下文丟失和工作流程中斷。
為何時機重要
上下文壓縮並不新鮮。這項技術用濃縮的摘要取代較舊的訊息,以保持代理在令牌限制內。但何時進行壓縮與是否壓縮一樣重要。
LangChain的實現識別出幾個最佳壓縮時機:用戶轉換焦點的任務邊界、從大量研究內容中提取結論後,或在開始長篇多檔案編輯之前。代理本質上學會在開始繁瑣工作前先整理清理,而不是在空間不足時慌亂。
2024年12月由Factory AI發表的研究支持這一方法。他們的分析發現,結構化摘要——保持上下文連貫性而非激進截斷——對於像除錯這樣的複雜代理任務至關重要。維持工作流程結構的代理在性能上明顯優於僅使用簡單截斷的方法。
技術實現
該工具作為Deep Agents SDK(Python)的中介軟體發布,並與現有的CLI集成。開發者將其加入代理配置中:
系統會保留可用上下文的10%作為最新訊息,同時對之前的內容進行摘要。LangChain內建安全機制——完整的對話歷史會保留在代理的虛擬檔案系統中,若壓縮出錯可進行恢復。
內部測試顯示,代理在觸發壓縮時較為保守。LangChain用他們的Terminal-bench-2基準測試和使用LangSmith追蹤的自定義評估套件驗證了此功能。當代理自主壓縮時,通常選擇能改善工作流程連續性的時機。
更廣的意義
此次發布反映了代理架構哲學的更廣泛轉變。LangChain明確引用了Richard Sutton的“苦澀教訓”——即利用計算的通用方法隨著時間推移往往優於手工調整的方法。
不再由開發者細緻配置代理何時管理記憶,框架將此決策委託給模型本身。這是一個押注:像GPT-5.4這樣的模型已經具備足夠的推理能力,能可靠地做出這些操作決策。
對於構建長時間運行或交互式代理的開發者來說,該功能可通過SDK選擇啟用,並在CLI中使用/compact命令。實際效果是:工作流程中斷更少,對用戶來說也不需要過多手動干預上下文限制,因為大多數終端用戶根本不理解這些限制。
圖片來源:Shutterstock