最近身邊很多人在討論 AI Agent,各種場景都有:自動審查 PR、自動寫測試、自動產生 release notes、自動回覆客服……
這讓我開始思考:「Agent」這個詞,到底指的是什麼?
如果把一個 PR review agent 拆解,大概長這樣:
PR 開啟 → webhook 觸發 → AI 執行審查 → 自動留言
其中「AI 執行審查」的部分,其實就是帶著一組指令去呼叫 AI API。指令可能長這樣:
「請審查這個 PR,特別注意命名規範、安全漏洞、以及是否有遺漏的測試。」
所以整個 Agent,可以分成兩個部分:
這是我覺得最有意思的地方。
在 AI 能動之前,你得先想清楚「這件事本來應該怎麼做」。以 PR review 為例:
這些問題,其實不管有沒有 AI,做好 code review 本來就需要回答。AI 只是讓這些「潛規則」變得需要被明確寫出來。
某種程度上,這是一件好事——它逼你把模糊的標準變成可以溝通的文字。
這部分是比較傳統的工程工作:串接 webhook、呼叫 API、處理錯誤、把結果送到對的地方。
不是沒有價值,但它和「AI 有多聰明」其實是兩件事。
我現在的理解是:Agent 就是一個帶著明確指令、會自動觸發的 AI 呼叫。
它不是一個全新的東西,更像是把原本要手動做的事情自動化——只是自動化的對象從「執行工具」變成了「呼叫 AI」。
這樣想之後,很多問題反而變得更清楚。沒有什麼火箭科學——把你想要的結果描述清楚,寫成一個好的 prompt,就是整件事的核心。觸發器、API 串接,都只是圍繞這件事搭起來的架子。