
【最新版】OpenClawのセッションプルーニング(Session Pruning)とは?初心者向けにやさしく解説
2026年3月18日
この記事の要点(TL;DR)
- 結論: Session Pruningは古い「ツールの実行結果」だけを、モデルに送る直前の文脈から間引く仕組みです(ディスク上の履歴を書き換えるわけではありません)。
- うれしい点: セッションがしばらく止まった後の再開1発目のコスト(cacheWrite)を下げやすく、キャッシュの挙動も安定します。
- 初心者の落とし穴: 「会話が要約される」ではなく、あくまでツール結果の整理。ユーザー/アシスタントの発言は基本そのままです。
次に聞くべき質問3つ
- 自分の運用は「頻繁に会話する」?それとも「たまに再開する」?(ttlの決め方が変わる)
- どのツールの結果が長くなりがち?(read/exec/web_fetchなど)
- “消えたら困る情報”はツール結果に入ってない?(必要なら保存先を変える/短くする)
Session Pruning(セッションプルーニング)とは?
OpenClawで会話(セッション)を続けていると、途中でツール(read や web_fetch など)を何度も使います。 その結果が長いと、次にAIへ投げる「会話の材料(コンテキスト)」が太って、料金や速度に影響が出やすくなります。
そこで出てくるのがSession Pruning。 これは“次の1回のAI呼び出しに送る文脈”を軽くするために、古いツール結果を整理する機能です。
ここはこういう意味:「履歴を削除する」のではなく、そのリクエストでモデルに見せる情報を一時的に減らすイメージです。 セッションの保存ファイル(*.jsonl)自体は書き換えません。
いつ動くの?(重要:TTLとキャッシュの関係)
Session Pruningは、特に「しばらく会話が止まった後」に効いてきます。 OpenClawのドキュメントでは、mode: cache-ttl を有効にして、最後の対象モデル呼び出しから ttl を超えたときに実行される、と説明されています。
イメージ:「しばらく使ってなかったノートを開き直すとき、前のページに貼った長い資料(ツール結果)だけを“いったん外して”軽くしてから再開する」感じ。 すると再開1回目に“全部貼り直す”コストが減りやすい、という考え方です。
何が削られる?何が削られない?
- 対象になりうる: toolResult(ツールの実行結果)のみ
- 基本そのまま: ユーザーの発言/アシスタントの発言(会話の本文)は変更されない
- 保護される範囲: 直近の一定数のアシスタント発言(
keepLastAssistants)は守られる - 画像を含む結果: 画像ブロック入りのツール結果はスキップ(= 触らない)
ここはこういう意味:「会話の流れ」はできるだけ保って、重くなりがちな“添付資料(ツール結果)”だけを整理する設計です。
Soft(やさしく)と Hard(バッサリ)の2段階
ドキュメントでは、プルーニングのやり方が2種類に分かれています。
- Soft-trim: 長すぎるツール結果を「先頭+末尾だけ残す」形で短くする(途中は
...みたいに省略) - Hard-clear: ツール結果を丸ごと置き換えて、
[Old tool result content cleared]のようなプレースホルダーにする
イメージ:Softは「重要そうな見出しと結論だけ残す」、Hardは「資料が邪魔なので“資料は消しました”メモだけ残す」です。
初心者向け:最小の設定例(考え方付き)
設定はGatewayのコンフィグ(例:agents.defaults)に入れます。 まずは「TTL付きで有効化」だけ覚えればOKです。
{
agents: {
defaults: {
contextPruning: {
mode: "cache-ttl",
ttl: "5m",
},
},
},
}ここはこういう意味:「最後にAIを呼んでから5分以上空いたら、次の呼び出し直前に“古いツール結果”を整理する」設定です。
もし「特定のツールだけ整理したい」なら、許可/拒否(allow/deny)で絞れます。 ただし最初は、困ったときに絞るくらいで十分です。
よくある不安:プルーニングすると賢さが落ちない?
可能性はあります。なぜなら、ツール結果の中に「推論に必要な根拠」が入っていることがあるからです。 ただ、Session Pruningは“ユーザー/アシスタントの会話本文は残す”前提なので、 「会話の目的」や「やりたいこと」は比較的残りやすい設計です。
対策としては、重要な情報は(1)会話本文として短く言い直す、(2)別の保存先(メモ/DB/記事)に残す、のどちらかが堅いです。
まとめ
- Session Pruningは、長い会話で増えたツール結果を、モデルに送る直前に整理する仕組み
- 特に「しばらく止まった後の再開」で、キャッシュ再作成のムダを減らしやすい
- 最初は
mode: cache-ttl+ttlから始めると迷わない
参考
関連記事

AIエージェントのメモリスタックとは?2026年に重要度が上がる理由をやさしく解説
2026年4月8日
OpenClaw vs Hermes vs Claude、創業者はどれを選ぶべき?2026年版の実務比較
2026年4月8日