
資料內(nèi)容:
什么是智能體系統(tǒng)?
智能體系統(tǒng)本質(zhì)上是一種計算實體,能夠感知其環(huán)境(包括數(shù)字和物理環(huán)境),根據(jù)這
些感知和預(yù)設(shè)或?qū)W習(xí)到的目標(biāo)做出決策,并自主執(zhí)行行動以實現(xiàn)目標(biāo)。與傳統(tǒng)軟件嚴(yán)格
按照固定步驟執(zhí)行不同,智能體具備一定的靈活性和主動性。
假設(shè)你需要一個系統(tǒng)來管理客戶咨詢。傳統(tǒng)系統(tǒng)可能只會按照固定腳本操作。而智能體
系統(tǒng)則能感知客戶問題的細(xì)微差別,訪問知識庫,與其他內(nèi)部系統(tǒng)(如訂單管理)交
互,甚至主動提出澄清問題,并預(yù)見客戶的后續(xù)需求。這些智能體在你的應(yīng)用基礎(chǔ)設(shè)施
畫布上運行,利用可用的服務(wù)和數(shù)據(jù)。
智能體系統(tǒng)通常具備如下特性:自主性,無需持續(xù)人工干預(yù)即可行動;主動性,能主動
采取行動實現(xiàn)目標(biāo);響應(yīng)性,能有效應(yīng)對環(huán)境變化。它們本質(zhì)上是目標(biāo)導(dǎo)向的,始終致
力于實現(xiàn)目標(biāo)。一個關(guān)鍵能力是工具使用,即能與外部 API、數(shù)據(jù)庫或服務(wù)交互?有
效地突破自身的限制。它們擁有記憶,能在多次交互中保留信息,并能與用戶、其他系
統(tǒng)或同一/關(guān)聯(lián)畫布上的其他智能體進行通信。
要有效實現(xiàn)這些特性,系統(tǒng)復(fù)雜度會顯著提升。智能體如何在畫布上跨多步保持狀態(tài)?
如何決定何時、如何使用工具?不同智能體之間的通信如何管理?如何為系統(tǒng)構(gòu)建彈性
以應(yīng)對意外結(jié)果或錯誤?
為什么模式對智能體開發(fā)至關(guān)重要
正因如此,智能體設(shè)計模式變得不可或缺。它們不是死板的規(guī)則,而是經(jīng)過實戰(zhàn)檢驗的
模板或藍(lán)圖,為智能體領(lǐng)域的標(biāo)準(zhǔn)設(shè)計與實現(xiàn)挑戰(zhàn)提供成熟的解決方案。識別并應(yīng)用這
些設(shè)計模式,可以提升你在畫布上構(gòu)建智能體的結(jié)構(gòu)性、可維護性、可靠性和效率。
使用設(shè)計模式能避免你為諸如對話流程管理、外部能力集成或多智能體協(xié)作等基礎(chǔ)任務(wù)
重復(fù)造輪子。它們?yōu)槟愕闹悄荏w邏輯提供了通用語言和結(jié)構(gòu),使代碼更易于理解和維
護。實現(xiàn)專為錯誤處理或狀態(tài)管理設(shè)計的模式,能直接提升系統(tǒng)的健壯性和可靠性。借
助這些成熟方法,你可以專注于應(yīng)用的獨特創(chuàng)新,而不是智能體行為的底層機制。
本書提煉了 21 個關(guān)鍵設(shè)計模式,作為在不同技術(shù)畫布上構(gòu)建復(fù)雜智能體的基礎(chǔ)模塊和
技術(shù)。理解并應(yīng)用這些模式,將極大提升你設(shè)計和實現(xiàn)智能系統(tǒng)的能力。
智能體的特征
簡單來說,智能體是一種能夠感知環(huán)境并采取行動以實現(xiàn)特定目標(biāo)的系統(tǒng)。它是從傳統(tǒng)
大語言模型(LLM)演化而來,具備規(guī)劃、工具使用和環(huán)境交互等能力??梢?把智能體
想象成一個能在工作中不斷學(xué)習(xí)的智能助手。它遵循一個簡單的五步循環(huán)來完成任務(wù)
(見圖 1):
1. 獲取任務(wù)目標(biāo):你給它一個目標(biāo),比如“幫我安排日程”。
2. 掃描環(huán)境信息:它會收集所有必要的信息?閱讀郵件、檢查日歷、訪問聯(lián)系人
?以了解當(dāng)前狀況。
3. 制定計劃:它會思考并制定實現(xiàn)目標(biāo)的最佳方案。
4. 執(zhí)行行動:它會發(fā)送邀請、安排會議、更新你的日歷來落實計劃。
5. 學(xué)習(xí)與優(yōu)化:它會觀察結(jié)果并不斷調(diào)整。例如,如果會議被重新安排,系統(tǒng)會從中
學(xué)習(xí)以提升未來表現(xiàn)。
Level 0:核心推理引擎
LLM 本身并不是智能體,但可以作為基礎(chǔ)智能體系統(tǒng)的推理核心。在“Level 0”配置
下,LLM 不具備工具、記憶或環(huán)境交互能力,僅依靠預(yù)訓(xùn)練知識進行響應(yīng)。它擅長解釋
已知概念,但完全無法感知最新事件。例如,如果 2025 年奧斯卡最佳影片不在其訓(xùn)練
數(shù)據(jù)中,它就無法回答。
Level 1:連接型問題解決者
此階段,LLM 通過連接外部工具成為真正的智能體。它的問題解決能力不再局限于預(yù)訓(xùn)
練知識,而是能執(zhí)行一系列操作,從互聯(lián)網(wǎng)(搜索)或數(shù)據(jù)庫(RAG)等渠道收集和處
理信息。詳細(xì)內(nèi)容見第 14 章。
例如,查找新電視劇時,智能體會識別需要最新信息,使用搜索工具獲取并整合結(jié)果。
它還能調(diào)用專業(yè)工具提升準(zhǔn)確率,比如通過金融 API 獲取 AAPL 的實時股價??绮襟E與
外部世界交互,是 Level 1 智能體的核心能力。
Level 2:戰(zhàn)略型問題解決者
此階段,智能體能力大幅提升,具備戰(zhàn)略規(guī)劃、主動協(xié)助和自我優(yōu)化,提示工程與上下
文工程成為核心技能。
首先,智能體不再只用單一工具,而是通過戰(zhàn)略性問題解決應(yīng)對復(fù)雜多步驟任務(wù)。執(zhí)行
過程中,它主動進行上下文工程:即為每一步戰(zhàn)略性篩選、打包和管理最相關(guān)的信息。
例如,查找兩地之間的咖啡館,智能體先用地圖工具獲取信息,再將輸出內(nèi)容(如街道
名列表)精簡后傳遞給本地搜索工具,避免信息過載,確保高效準(zhǔn)確。要讓 AI 達(dá)到最
高準(zhǔn)確率,必須提供簡短、聚焦且高效的上下文。上下文工程正是通過戰(zhàn)略性篩選和管
理關(guān)鍵信息,實現(xiàn)模型注意力的有效分配。詳細(xì)內(nèi)容見附錄 A。
這一階段還帶來主動、持續(xù)的操作。例如,旅行助手連接郵箱后,會從冗長的航班確認(rèn)
郵件中提取關(guān)鍵信息(航班號、日期、地點),再打包給日歷和天氣 API。
在軟件工程等專業(yè)領(lǐng)域,智能體通過上下文工程管理整個工作流。收到 會讀取報告和代碼庫,
并將大量信息精煉為高效上下文,從而高效編寫、測試和提交正 bug 報告后,它
確的代碼補丁。
最后,智能體通過優(yōu)化自身上下文工程實現(xiàn)自我提升。它會主動請求反饋,學(xué)習(xí)如何更
好地整理初始輸入,從而自動優(yōu)化未來任務(wù)的信息打包方式,形成強大的自動反饋循
環(huán),不斷提升準(zhǔn)確率和效率。詳細(xì)內(nèi)容見第 17 章。