分類
AI
AI 工具解析
本週在吵什麼
工程師講人話
2026
Surya 正在補上的,不只是 OCR,而是 AI 文件理解最容易失真的那一層
Outlines:LLM 結構化輸出不是把 JSON 修漂亮,而是把格式約束提前到生成當下
TRL:不是又一個微調工具,而是把 LLM 後訓練變成可重複工程流程的開源底座
pyannote.audio:當 AI 逐字稿開始要分清誰在說話,這個開源工具補上的是語音工作流裡最容易被忽略的一段
Hunyuan3D-2:AI 3D 資產開始能進入設計流程,但離量產素材庫還有距離
機器人 AI 不是先缺模型,LeRobot 補的是資料、控制與訓練那條斷掉的線
F5-TTS 把 AI 配音從實驗室拉進內容產線,但別把它當成可無限複製真人聲線的捷徑
Onyx:很多公司缺的不是另一個 AI Chat,而是能接住內部知識的工作入口
Ragas:當 AI 團隊不想再靠 vibe check 上線,這套開源 eval 框架補的是哪一段
Aider:不是再多一個 AI 寫程式介面,而是把變更、回滾與測試拉回同一條工作線
llama.cpp 不是聊天玩具,它正在變成開源模型落地的本地推理底座
OpenAI Agents SDK:把 AI Agent 從工具呼叫包裝成可運行系統,但別把它當萬能編排層
當 AI 每次開新對話都像失憶,Mem0 為什麼開始被討論
SkyPilot 把 AI 團隊最容易失控的算力調度,拉回同一個控制面
當團隊不只接一個模型,LiteLLM 為什麼開始變成必需品
當 AI 團隊開始自己造資料,Distilabel 為什麼值得重新看
E2B 正在補上 AI Agent 最容易被跳過的執行隔離層
當模型愈來愈便宜,Label Studio 為什麼又回到 AI 團隊桌上
BentoML 正在補上 AI 團隊最容易低估的交付層
當 AI 團隊開始自己養網頁資料,Crawl4AI 正好補上最容易爛掉的那一段
Open WebUI 不只是聊天介面,它正在長成企業自建 AI 入口層
當知識庫每天都在變,Pathway 比再疊一層 RAG 工具更值得先看
marimo 正在把 AI 實驗筆記從一次性草稿拉回可交付工作台
會說話已經不稀奇了,LiveKit Agents 想解的是語音 AI 上線後最難養的系統線
PydanticAI 正在補上 AI 應用最容易被低估的那段工程債
每次改 prompt 都像在拆盲盒,Promptfoo 想先把 AI 功能變成可測試的產品
Gitingest 值得現在看嗎?真正卡住 AI 寫程式的,常常不是模型不夠強,而是你根本沒有把 codebase 整理成它吃得下的上下文
Docling 值得現在看嗎?真正難的不是把 PDF 轉成文字,而是你把版面、表格與脈絡一起弄丟了
Qdrant 值得現在看嗎?真正卡住 RAG 上線的,常常不是模型不夠強,而是你的檢索層根本沒有工程化
Unsloth 值得現在看嗎?微調門檻確實降下來了,但別因此以為每個團隊都該自己養模型
GraphRAG 值得現在看嗎?真正卡住企業知識問答的,常常不是找不到文件,而是你根本連不起資料之間的關係
Dify 值得現在看嗎?真正麻煩的不是你做不出 AI app,而是每做一個都像重起一間小型軟體公司
Ollama 值得現在看嗎?真正有價值的,不只是把模型跑在本機,而是把 AI 的資料邊界、原型速度與模型主導權拿回來
Continue 值得現在看嗎?真正卡住團隊寫程式的,常常不是 AI 不會寫,而是沒有人能穩定把關 PR 品質
Langfuse 值得現在看嗎?AI 產品真正難的不是把模型接上去,而是你根本不知道它為什麼出錯
FastMCP 值得現在看嗎?真正麻煩的不是你不會做 AI 工具,而是你把 MCP 寫成一次性膠水
ComfyUI 值得現在看嗎?真正麻煩的不是 AI 生不出圖,而是你的生成流程根本無法重現
DSPy 值得現在看嗎?真正卡住 AI 產品的,常常不是 prompt 寫不好,而是你根本無法系統化把它變好
BAML 值得現在看嗎?真正麻煩的不是 prompt 不會寫,而是它一直停在字串階段
AI 越強,越沒人能替你負責,當責才是這個時代最稀缺的能力
SGLang 值得現在看嗎?開源模型真正難的不是跑起來,而是撐住延遲、吞吐與成本
Open WebUI:它真正賣的不是聊天介面,而是把公司內部 AI 入口收回自己手上
Ollama:把本地大模型變簡單了,但別把它當成完整的 AI 平台
LangGraph 值得現在看嗎?把 AI Agent 從 Demo 拉到可控流程的一套開源底座
OpenHands 值得追嗎?從代理式寫程式到可控執行,拆解這個最像「開源 Devin」的 AI 專案
Docling:把文件解析從抽文字,推進到 AI-ready 的資料層,但代價也更重
Browser Use:讓 AI Agent 真的能操作網站,但離可靠上線還有距離
MarkItDown:把文件轉成 LLM 真正吃得下的 Markdown,但別把它當萬能解析器
PydanticAI:把 AI Agent 從 prompt script 拉回工程系統,但前提是你本來就在 Python 生態裡
Autoresearch:把 LLM 訓練研究流程外包給 Agent,但不是每個團隊都該照抄
Crawl4AI:把網站變成 LLM 讀得懂的資料層,不只是另一個爬蟲
Claude Code 加上 LSP,改變的不是會不會寫,而是你還要不要在大型專案裡瞎找
Pydantic AI:把會動的 Agent,變成能上線的系統
AI Agent 真正缺的,不是更長的 Prompt:Mem0 的記憶層思路
模型一多就會亂:LiteLLM 想做的不只是 API 轉接
不是每次都重算:LMCache 怎麼把 LLM 推理裡最貴的 prefill 省下來
What is a machine?把 AI 當成機器,你就能用規格和測試管住它
推薦系統也有「黃金比例」了?
AI 分手潮來了?OpenAI 撤掉 GPT-4o,有人說「失去生命中重要的人」
中國開源AI的下一步,你可能誤會了
AI Bot 成為主要流量來源:內容站接下來的 KPI 可能不是『PV』而是『可被機器理解』
把 ChatGPT 變成『組織能力』:沃爾夫斯堡案例給企業匯入 AI 的三個教訓
AI-only 社群『Moltbook』:當人類被排除在外,網路文化會變成什麼樣?
UI 在地化的下一步:不是翻譯,而是『產品語氣』與『文化預設』
開源 AI 生態一年後:DeepSeek 之後,真正的競爭不在模型,而在『供應鏈』