Series / Pillar Page

Self-hosted AI Agent 實戰系列

從零開始部署、優化、營運自架 AI Agent 的完整紀錄。涵蓋框架選型、context window 優化、tool 精簡、搜尋後端替換等實戰經驗。

這個系列在講什麼

這個系列不是在教「五分鐘架好 AI Agent」，而是把我真的在做的事情攤開來：為什麼要 self-host、框架怎麼選、context 怎麼瘦身、tool 怎麼收斂、搜尋後端怎麼替換、還有整個系統怎麼維持在可運作的狀態。

如果在意的是 可控性、長期成本、工作流整合，而不是單次 demo，這個系列應該會比較有參考價值。

為什麼我決定自架一個 AI Agent — 已發布
從 consult 到 harness，為什麼我要自己掌握 agent 的 orchestration 與 adaptation。
框架選型：Hermes vs 其他方案 — 撰寫中
我實際在意的不是 feature list，而是 context、tooling、automation 與 operator fit。
Context Window 瘦身：從 199K 壓到 68K tokens — 規劃中
如何拆掉高噪音系統 prompt、降低重複 context、把 retrieval 變得便宜。
Tool 精簡：從 64 個 tools 收斂到 35 個 — 規劃中
工具不是越多越好，重點是模型什麼時候會誤用，以及怎麼縮小 decision surface。
搜尋後端替換：用 SearXNG 取代商業搜尋 API — 規劃中
降低成本、增加可控性，並讓搜尋和私有資料流更容易接在一起。
把 Obsidian vault 接進 agent workflow — 規劃中
不是單純 RAG，而是讓 agent 真正讀寫我每天在用的知識系統。
Discord / chat surface 串接與 operator UX — 規劃中
怎麼把 agent 放進日常通訊介面，而不是把人逼回 terminal。
Self-hosted reliability：cron、watchdog、fallback 設計 — 規劃中
agent 不是 demo，得能在凌晨壞掉時還有辦法被發現、被修復。
從 single-agent 到 multi-agent orchestration — 規劃中
什麼時候真的需要 subagents，什麼時候只是把問題複雜化。
把 agent 變成長期可維護系統 — 規劃中
最後一篇談 observability、技術債、版本演進與「不要讓自己的 automation 反咬自己」。

范耿誌 Rance，網路上多半用 Wildsky 這個名字。平常在做軟體工程，也長期折騰 AI tools、 PKM、self-hosting 與各種把 workflow productize 的方法。