當 AI 每次開新對話都像失憶,Mem0 為什麼開始被討論

如果你是客服主管,最近大概很容易撞到一種很悶的問題。

你的 AI 助理單次對話看起來不差,語氣也順,FAQ 也答得出來。可是一旦同一個使用者隔天再回來,它又像第一次見面。昨天才說過偏好 email 聯絡,今天又改問要不要電話。上週才抱怨過某個功能流程很卡,這週它還是照本宣科,把對方當成毫無背景的新客。

這種落差,不會在 demo 裡特別明顯,上線後卻很傷。因為使用者感受到的不是模型笨,而是這個系統根本沒有把我當成同一個人。

我看過一種很真實的現場細節。團隊在週會裡放出一段對話紀錄,螢幕左邊是這週新回覆,右邊是上週工單摘要。有人指著 CRM 上那行偏好繁中、不要電話、習慣月底結帳嘆一口氣,因為這些資訊公司明明知道,AI 卻每次都像重新入職。

Mem0 之所以值得看,就在這裡。

它想補的不是單次回答能力,也不是把 context window 再撐大一點。它在解的,是 AI 產品一直很欠缺的一層,怎麼把跨對話、跨 session、跨任務的重要記憶留下來,而且下次真的拿得回來用。

English TL;DR

  • Mem0 is an open source memory layer for AI applications and agents, designed to persist useful context across sessions instead of treating every interaction like a fresh start.
  • Its value is not more context, but better memory extraction and retrieval: storing facts, preferences, and history in a structured memory system rather than dumping full chat logs back into prompts.
  • It is especially useful for support bots, personal AI assistants, and workflow agents that need continuity over time.
  • But it is not a free upgrade. Memory quality depends on extraction accuracy, retrieval strategy, privacy governance, and operational discipline. Wrong memories can accumulate, and some benchmark gains belong to the managed platform rather than OSS alone.
  • Pragmatic takeaway: adopt Mem0 when continuity is part of the product promise, not when your AI feature is still a one-shot utility.

問題不是聊天變長,而是關係永遠重開機

很多團隊一開始想到 AI 要有記憶,直覺做法都差不多,就是把更多聊天紀錄塞回 prompt。

短期內這當然能撐一下,但它很快會碰到幾個現實問題。第一,token 成本會一直長。第二,舊對話不是每一句都有價值,真正重要的通常只有少數事實、偏好、承諾、狀態更新。第三,原始對話越長,檢索越容易變鈍,模型也不一定能穩定抓到最該記得的那一段。

Mem0 的設計思路,比較像是承認一件事,聊天紀錄不等於記憶。

根據 README 與文件,它把自己定位成一個 universal memory layer。不是單純保存 transcript,而是把新對話經過抽取、去重、嵌入、連結,再用比較像檢索系統的方式,在下次需要時拿回來。它支援 library 直接嵌進 app,也支援 self-hosted server,讓團隊用 dashboard、API keys、audit log 來管理。

這個定位很重要。因為它代表 Mem0 想做的,不是讓你把歷史對話背得更久,而是讓 AI 對哪些事值得記住這件事開始有結構。

你不是缺更多 token,你是缺一層會做筆記的系統

如果把 Mem0 拆開看,它其實很像替 agent 或 AI 助理補上一個記憶中介層。

官方文件把流程分成兩段,寫入與讀取。

寫入那段大意是這樣,新的對話來了之後,系統不會直接把全部內容原封不動存起來,而是先找相關既有記憶,避免重複,接著用 LLM 做單次抽取,把值得留下的事實寫成 memory,再做去重、embedding,最後補上 entity linking。文件裡甚至特別強調現在的新演算法是 ADD-only extraction,也就是新事實加入,但不急著覆寫舊事實,讓時間脈絡保留下來。

讀取那段也不是只做向量搜尋。Mem0 現在走的是 multi-signal retrieval,把 semantic search、BM25 關鍵字比對、entity matching 一起算,再融合排序。換句話說,它知道有些查詢靠語意,有些要靠精準字詞,有些則和人名、產品名、專案名這種實體更有關。

這也是它比把上一輪聊天貼回去更像產品基礎設施的原因。因為它處理的是記憶抽取、記憶索引、記憶召回,而不是單純把對話越留越長。

三種場景,Mem0 真的會比一般 chat history 更有感

場景一,客服 AI 不是答不出來,而是老是把熟客當陌生人

這大概是最好理解的一種場景。

例如使用者上週剛抱怨過某個功能不穩,偏好繁中說明,不想接電話,只接受 email 回覆。這些資訊如果每次都要靠客服工單系統另外查,AI 回答就很容易斷掉。Mem0 這類記憶層的價值,在於把這個人有哪些長期偏好、最近發生過什麼、哪些事不要重問變成可檢索記憶。

這時它補到的,不只是體驗更順,而是服務成本真的會下降。因為少一次重問,少一次轉人工,通常就已經有感。

場景二,個人 AI 助手要的不只是聰明,還要有連續性

很多 AI 助手產品第一版都卡在這裡。單輪很會答,可是到了第二週,系統還是不知道你習慣什麼工作節奏、討厭什麼格式、長期在推哪個專案。

Mem0 這種做法很適合拿來記使用者偏好、例行工作、常見協作對象、重複出現的任務背景。對知識工作者來說,價值往往不是它知道更多百科知識,而是它終於不用每次都從頭重新理解我。

這也是為什麼 README 會一直把 personal AI assistant 放在前面。真正有產品感的助理,靠的通常不是一次答很神,而是十次互動後開始有累積。

場景三,Agent 會做事之後,狀態延續比即時推理更麻煩

只要 agent 開始碰工具、任務、流程,記憶問題就會變得更硬。

例如一個銷售助理 agent,上次已經幫某客戶整理過採購限制、預算區間、偏好的導入方式,這次再進來,不應該又像零背景 cold start。又或者專案型 agent 已經做過幾輪任務,確認過哪些步驟成功、哪些失敗、哪些人有權限,這些東西如果只活在當下 context,系統每次都得重建。

Mem0 在這裡的價值,不是幫 agent 變聰明,而是幫它不要那麼容易失憶。這兩件事差很多。

它的 benchmark 很亮眼,但讀數字要保留一點戒心

Mem0 這波會被討論,還有一個原因是它把 memory evaluation 講得很完整。

官方文件拿 LoCoMo、LongMemEval、BEAM 這些 benchmark 來說明它的新演算法,重點不是只追求準確率,而是同時看 accuracy、cost、latency。文件主打的是 token efficiency,也就是用不到 7,000 tokens 左右的 retrieval 成本去換取不錯的記憶召回,而不是動不動把 25,000 tokens 以上的全文上下文塞回去。

這個方向其實很對。因為 production 真正在乎的,本來就不是理論上能不能記得,而是你打算花多少 token、多少延遲,把記住這件事撐下去。

但比較務實的看法是,這些 benchmark 只能幫你理解方向,不能直接等於你家產品的成績。官方文件自己也寫得很清楚,部分 benchmark 成果來自 managed platform 的 proprietary optimizations,OSS 使用者不該直接假設能拿到同樣數字。

這種自我揭露反而是好事。因為它提醒了兩件事,第一,記憶系統不是裝了就自動變強。第二,開源版、self-hosted 版、平台版之間,實際效果與維運體驗本來就可能有差。

記住,不代表知道什麼該忘

Mem0 值得看,但也很容易被想得太浪漫。

1. 記憶品質,最後還是回到抽取品質

如果系統把錯的偏好記住,把過期事實當成有效記憶,後面每次召回都會把錯誤放大。這是所有 memory layer 都逃不掉的問題。

Mem0 現在強調 ADD-only,有它的好處,像是保留時間脈絡、不急著覆寫舊資訊。但另一面也代表,如果你的上層治理做得不好,記憶有可能越存越多,衝突也越來越多。最後不是沒有記憶,而是記憶太多,還彼此打架。

2. 它不適合每一種 AI 產品

如果你的產品本質上是一次性任務,例如單次文件摘要、臨時生成文案、偶發查詢工具,那未必需要長期記憶。硬加一層 memory,可能只是在加複雜度。

另一種不太適合的情境,是每次回答都必須嚴格只依賴當前權威資料來源,例如某些法規、金融、醫療、合約審閱流程。這種場景不是不能用記憶,而是要很小心,因為 persistent memory 可能把舊習慣、舊偏好、甚至舊事實摻進本來應該極度受控的回答流程。

3. 你要處理的不只是技術,還有資料治理

記憶系統一旦上線,問題就不再只是 retrieval score。

你得面對哪些資訊可以記,哪些不該記,保留多久,怎麼刪,怎麼 audit,跨使用者隔離怎麼做。Mem0 的 self-hosted server 確實提供 dashboard、API keys、request audit log,這些都是好訊號,但也剛好說明了一件事,這已經不是玩具層級的功能,而是資料治理層級的責任。

4. 它不是零成本元件

文件裡的預設很清楚。直接用 library 時,預設會牽涉 OpenAI LLM、OpenAI embeddings、local Qdrant、SQLite history。self-hosted server 又是另一套堆疊,預設包含 Postgres + pgvector,還有 provider 設定、auth 與 dashboard。

也就是說,Mem0 不是單一 Python 套件那麼簡單。你當然可以很快開始,但要走到正式環境,還是會碰到模型、embedding、向量庫、權限、成本與維運這整串問題。

比起把所有對話都塞回 prompt,這是比較成熟的一步

如果把 Mem0 放回整個 AI 應用演進脈絡看,它代表的是一個很實際的轉折。

早期大家都在比模型,接著開始比 workflow,現在越來越多產品要面對的是,當 AI 不再只是一次性回答器,它怎麼成為一個有連續性的系統。

Mem0 值得看的地方,不在於它保證解完這題,而在於它很準地抓到這個轉折點,並且把記憶層做成可以工程化討論的東西。

採用判斷也不難下。

如果你的 AI 功能承諾的是長期陪伴、個人化、跨任務延續,或者 agent 已經開始真的替人做事,Mem0 很值得花時間評估,至少先從小範圍 pilot 開始。
如果你的產品還停在單輪問答、一次性工具,或資料治理邊界非常嚴苛,現在先不上這層,反而可能更穩健。

說到底,Mem0 提醒的是一件很基本的事,不是每個 AI 都需要記憶,但凡是想被當成助手的 AI,遲早都得學會記得人。

換個腦袋讀

想再讀深一點?

深入解讀
ChatGPT Google AI

相關文章