2026 年の AI エージェントメモリ: ナレッジグラフ、時間的ファクト、OS スタイルページング

2023 年に構築されたエージェントに先週何を伝えたか尋ねれば、楽しく何かを作り上げます。なぜなら、それはアイデアがないためです。モデルのコンテキストウィンドウ — どれほど大きくても — は作業メモリ、長期メモリではありません: 現在のプロンプトに適合するもの保有し、会話終了または窓の溢れた瞬間フォーゲット。1 回限りの質問に答えるチャットボット向け、それは大丈夫です。数週間をかけてアシストする、あなたの好みを覚える、プロジェクト追跡、または時間とともに変わる事実について推論するエージェント向け、それは致命的制限です。より大きいコンテキストウィンドウはこれを直しません; それらは単にフォーゲットを遅延させ、各呼び出しをより高額にします。エージェント必要なのはメモリ レイヤー — 何を永続化するか決定し、検索されるよう構造化でき、重要なときに関連スライスをコンテキストに戻すシステムです。

2026 年までに、エージェントメモリは独自の規律、独自のツール、ベンチマーク、建築論争を備えています。このガイドはランドスケープを調査: コンテキストウィンドウはなぜメモリではないか、3 つの支配的建築アプローチ (ベクトル、グラフ、時間的)、及び実装するリーディングオープンソースフレームワーク — Mem0, Cognee, Graphiti と Zep, 及び Letta/MemGPT。ゴールはあなたがあなたのエージェントが実際に必要というメモリの種を推論でき、フレームワークが適합するも達成から去り、むしろ最後にトレンド何に達するより。

コンテキストウィンドウはなぜメモリではないか

誘い議論は: コンテキストウィンドウは成長するため、単にプロンプトにすべて置け。これは 3 つの具体的理由で失敗。最初に、コスト及び遅延スケールコンテキストで。プロンプト内のすべてのトークンは各呼び出しで支払われるため、月の履歴をそれぞれの要求に詰めるエージェントはお金を焼かせ直線でどのくらい「覚える」で遅くするか。第二に、関連は大量のトークンで低下。モデルは非常に長いコンテキストを超えて不完全に参加し、埋める 1 つの関連ファクトを数万の無関連トークン間で測定可能に傷つけるか取得と推論 — 「中で失われた」問題。第三、最も根本的に、ウィンドウは一時的。セッション終了時、コンテキストは去ります。セッションが何も意図的に保管しない限り、次の会話に永続何も。

メモリレイヤーはアプローチを反転して全 3 つを解きます。すべてを担持する代わりに、それはコンテキスト外の耐久性について情報を保存し、各ターンで取得のみ小、関連スライスを注入。エージェントのプロンプトはリーン保たれ、コストはバウンド保たれ、関連は高い保たれ — 重大でも — メモリはセッション生き残ります。興味深い質問ではなく whether メモリレイヤー持つ必要はないが *how それは構造化される必要、及びその場所アプローチ相違.

アプローチ 1: ベクトルメモリ

最も簡単なメモリレイヤーはエンベッディングでファクトをベクトルデータベースに保存しセマンティック類似度で取得 — エージェント独自の履歴に適用 RAG 本質的に。エージェントが何か学ぶとき (「ユーザーはダークモード希望」)、それは埋め込みストアされ; コンテキスト必要時、それは現在状況を埋め込み最も近いストアされたメモリを取得。これはファウンデーション、それは良く特定の仕事のため働く: 個別ファクトの人格化と回想。

Mem0 はこの型のリーディングフレームワーク、及び生ベクトルストアより高度。オファーマルチティアシステム — ユーザー、セッション、エージェントスコープ — バックアップベクトル + グラフリレーション + キー値ルックアップハイブリッドストア、及びアクティブメモリ management: 会話から生成セリファクト抽出、統合、盲目付加するのでなく更新。会話型人格化 — メモリ名、好み、反復タスク — しばしば正確に正しい、及びユーザーについて本質的に良く管理ファクトのセット必要なとき最強チョイス。

純粋ベクトルメモリの制限は各ファクトを独立ポイントとして扱う。「ユーザーは Acme で動作」「ユーザーは CTO」取得可能だが、本質的代表しないこれらファクト connected、またはリレーション網を超え推論。メモリ必要な構造 — リレーション間ファクトほぼファクト問題 — グラフは画像に入ります。

アプローチ 2: グラフメモリ

グラフベースメモリ情報をストア ナレッジグラフ: ノードでエンティティ、リッジでリレーション。独立ファクトの袋の代わりに、エージェントのメモリは接続構造化それは横断可能に、ベクトル類似度届かない推論をアンロック — マルチホップ質問、「X と Y どのように関連」、および多くのリンクファクトを越て合成。

Cognee グラフネイティブアプローチを例示 ECL パイプライン — Extract, Cognify, Load. 多くのソースタイプからデータを取り込み、「cognify」ことでグラフを構築してナレッジグラフエンティティ・リレーション、取得用のグラフ + ベクトルストアにロード。結果は受動ストア代わりにアクティブ、クエリ可能構造、ローカルファースト、プライバシークリティカルデプロイメント向け適合、グラフ推論クラウド依存なく。エージェント必要な接続ドット知識体を超え — 隔離ファクト単に回想でなく — グラフメモリ Cognee のような建築はそれを支持。

グラフメモリの強みはまさにその構造、及びコストはグラフ構築・保守 vector drop ストアより多く働く。抽出は正しくエンティティ・リレーション認識、及びグラフは新情報到着すると更新。エージェント値がリレーション知識を推論する理由に依存するなら、そのコストは支払う価値; シンプル人格化のため、それはオーバーキル。

アプローチ 3: 時間的メモリ

グラフはリレーション撮捉、しかし平ダイヤモンドは微妙盲点: 表現何が真実でなく *when それが真実かまたはそれはどう変わったか. 実世界ファクト履歴 — 誰かがジョブ変更、プロジェクトはフェーズ移動、好みアップデート — 及びエージェントが古いファクト上書きしたら理由変更を失う、一方古いなしで保持エージェント取得時間構造矛盾. 時間的ナレッジグラフ すべてのファクトに有効時間を付着することでこれを解き.

Graphiti, Zep の下エンジン, リーディングオープンソース実装. リッジはバイテンポラル, トラック両方いつファクト世界で真実か及びいつ取り込まれた、および重大 — いつファクト変わるか、Graphiti 削除古いもの. 古いリッジ無効マークタイムスタンプ新しいもの記録, 履歴は保存ポイントイン時間クエリ (「最後月の時点で何が真実か?」) 可能. エピソードなしで増分取り込みアジャを追加全グラフ再計算, メモリ留まる電流は安い方. エージェントは事実が時間とともに変わるに依存していつあってもし時間的メモリはアプローチ、及び Graphiti/Zep はその最明アプレッション.

時間的能力は2026年エージェントメモリの辺界正確そのため多くリアルエージェントタスク関与進化状態. エージェント追跡カスタマーリレーション, コードベース, またはロングプロジェクトなしで時間的淹れ — 每更新か消すか履歴または蓄積矛盾. 時間的グラフは与える原理回答.

アプローチ 4: OS スタイルメモリ管理

4 番目アプローチ完全に問題を再フレーム. むしろ個別ストアアプリケーションクエリ, MemGPT — 今 Letta フレームワーク — モデルメモリ後のオペレーティングシステム. コンテキストウィンドウ RAM: 高速、小、保有現在アクティブ. アーカイバルストレージディスク: 大, 検索可能, 保有すべてそれ以外. エージェント自身 OS, ツール呼び出し経由決定何をメインコンテキストにページイン及びアーカイバルメモリに書き出す. エージェント編集独自常時インコンテキスト「コアメモリ」ブロック学習, 及び検索アーカイバルメモリ他のそれはページアウト.

このモデルのエレガンスはメモリ管理エージェント独自責任, ツール経由行使, アプリケーション通りロジック代わり. これ Letta 特に適合 ロングラン自律エージェント 最小外調整で拡張操作上見ばえがメモリ管理を維持する必要がある — エージェントプログラム独自アドレス空間を管理方法自身のメモリを管理. トレードオフ正確にメモリに埋め込む何を保管し取得するかのアプリケーション厳密外制御望む時代働き良好エージェント有能及びタスク報酬自律, 少なく時代.

メモリ操作: 抽出、統合、フォーゲット

ストレージ建築を超え, メモリレイヤー manage 何をストア, 及びこの操作サイド分離リアルメモリシステム栄化ログから. 3 つ操作問題. 最初抽出: 生会話をストアメモリに回す. すべての文が覚えていう価値ありません, ストレージすべてコンテキスト窓問題異なる場所再発. 良いメモリシステム生成セリファクト抽出 — 好み、決定、エンティティ、リレーション — 及び捨てるおしゃべり, これはフレームワーク Mem0 する活発ファクト抽出むしろ全トランスクリプトダンプストアにしてなぜ.

第二は統合: 新情報を既ストレージ内で調和. エージェント学ぶ何かは既メモリアップデート・矛盾, 素朴システムどちらか重複作成 (ストアは類似ファクト満杯) または盲目上書き (履歴失う). 洗練メモリレイヤー検出新ファクト関連既古い及び統合 — マージ複製, 値アップデート, または時間的システムで, 無効化古いファクト新のタイムスタンプ記録. 違いは時刻上向きメモリ及びメモリ矛盾の積み重ね堕落. これは操作動作決定メモリ品質改善またはロット低下時刻を超え、及びそれはチェック価値あり, なぜフレームワーク自動このしたい対アプリケーション, ストアするものを。

3 番目, 過小評価, 操作は フォーゲット. 人間メモリ忘れ適応的, 保有何が問題及びしておき無関関連詳細, エージェントメモリ需要アナログ. いかなるプルーニングもなく, ロングリビングエージェントのメモリ成長境界, 取得遅く, 古ファクト汚染結果. 意図的フォーゲット — 低値メモリ減衰, アーカイブ何がアクセスされていない, またはメモリサイズをキャップ — ホスト保つシステム健全. フレームワーク相違どのくらいこれ自動対アプリケーションに去りレイブ, 及びそれはチェック価値あり, なぜメモリレイヤーのみ常に蓄積することは最後的には低下メモリレイヤー. フレームワーク評価時, 聞くまずこれはストアメモリしかし含抽出、統合、フォーゲット方法, なぜその操作動作決定メモリ品質改善またはロット.

メモリレイヤー選択

決定は従ってエージェント実際に覚える及び方法必要. 人格化と回想ユーザーファクト — メモリ好み・履歴 — サタート Mem0; 管理, マルチティアベクトル中心メモリは目的構築それあり最低ウェイト選択採用. もし リレーション知識推論エージェント が, 合成しなければならない関連ファクト, グラフネイティブレイヤー選択 Cognee, 特に遅いとき & 最初プライバシー問題. もし ファクト変わるエージェント依存時間をかけて 及び現在真実を推論しながら履歴保存の必要, 時間的グラフ選択 Graphiti/Zep. そして ロングラン自律エージェント構築 最小調整でメモリを自ら管理する, 選択 Letta/MemGPT.

カテゴリは厳密でない — Mem0 グラフリレーションほぼ, Cognee ブレンドグラフ & ベクトル, 及び実システム多くのアプローチ組み合わせ. けれども重心フレーミングは有用: エージェント覚える shape に建築をマッチ. 共通ミスはアプリケーション指しないため能力複雑コスト支払いながら時間的ナレッジグラフ到着時, 反対ミスか。根本的に不可能なフラットベクトルストア不動産変わるを推論する必要があるエージェントに着錯です。診断メモリ必要最初, それから選択それに適合する建築.

ボトムライン

コンテキストウィンドウはメモリ作業でなく長期メモリ: 一時的, 成長コストが高く不集中, 及びセッション間すべてフォーゲット. リアルエージェントメモリ存在専用レイヤー永続情報外コンテキスト及び取得関連スライス要求, 及び2026年そのレイヤー 4 フレーバー来る — 人格化ベクトル (Mem0), リレーション知識グラフ (Cognee), 時間的グラフファクト変わる時間 (Graphiti/Zep), 及び OS スタイルページング自律ロングランエージェント (Letta/MemGPT). 診断エージェント実際に覚える必要, マッチ建築適合, 及びエージェント停止作り上げ先週について — なぜなら実際覚えるため.

リファレンスとリソース

フレームワーク

バックグラウンド及び分析

リレーション 1337skills チートシート

Mem0, Cognee, Graphiti, Zep, MemGPT/Letta
LangGraph, GraphRAG, Qdrant