【最新版】OpenClawのセッションプルーニング（Session Pruning）とは？初心者向けにやさしく解説

2026年3月18日

この記事の要点（TL;DR）

結論: Session Pruningは古い「ツールの実行結果」だけを、モデルに送る直前の文脈から間引く仕組みです（ディスク上の履歴を書き換えるわけではありません）。
うれしい点: セッションがしばらく止まった後の再開1発目のコスト（cacheWrite）を下げやすく、キャッシュの挙動も安定します。
初心者の落とし穴: 「会話が要約される」ではなく、あくまでツール結果の整理。ユーザー/アシスタントの発言は基本そのままです。

次に聞くべき質問3つ

自分の運用は「頻繁に会話する」？それとも「たまに再開する」？（ttlの決め方が変わる）
どのツールの結果が長くなりがち？（read/exec/web_fetchなど）
“消えたら困る情報”はツール結果に入ってない？（必要なら保存先を変える/短くする）

Session Pruning（セッションプルーニング）とは？

OpenClawで会話（セッション）を続けていると、途中でツール（read や web_fetch など）を何度も使います。その結果が長いと、次にAIへ投げる「会話の材料（コンテキスト）」が太って、料金や速度に影響が出やすくなります。

そこで出てくるのがSession Pruning。これは“次の1回のAI呼び出しに送る文脈”を軽くするために、古いツール結果を整理する機能です。

ここはこういう意味：「履歴を削除する」のではなく、そのリクエストでモデルに見せる情報を一時的に減らすイメージです。セッションの保存ファイル（*.jsonl）自体は書き換えません。

いつ動くの？（重要：TTLとキャッシュの関係）

Session Pruningは、特に「しばらく会話が止まった後」に効いてきます。 OpenClawのドキュメントでは、mode: cache-ttl を有効にして、最後の対象モデル呼び出しから ttl を超えたときに実行される、と説明されています。

イメージ：「しばらく使ってなかったノートを開き直すとき、前のページに貼った長い資料（ツール結果）だけを“いったん外して”軽くしてから再開する」感じ。すると再開1回目に“全部貼り直す”コストが減りやすい、という考え方です。

何が削られる？何が削られない？

対象になりうる: toolResult（ツールの実行結果）のみ
基本そのまま: ユーザーの発言／アシスタントの発言（会話の本文）は変更されない
保護される範囲: 直近の一定数のアシスタント発言（keepLastAssistants）は守られる
画像を含む結果: 画像ブロック入りのツール結果はスキップ（= 触らない）

ここはこういう意味：「会話の流れ」はできるだけ保って、重くなりがちな“添付資料（ツール結果）”だけを整理する設計です。

Soft（やさしく）と Hard（バッサリ）の2段階

ドキュメントでは、プルーニングのやり方が2種類に分かれています。

Soft-trim: 長すぎるツール結果を「先頭＋末尾だけ残す」形で短くする（途中は ... みたいに省略）
Hard-clear: ツール結果を丸ごと置き換えて、[Old tool result content cleared] のようなプレースホルダーにする

イメージ：Softは「重要そうな見出しと結論だけ残す」、Hardは「資料が邪魔なので“資料は消しました”メモだけ残す」です。

初心者向け：最小の設定例（考え方付き）

設定はGatewayのコンフィグ（例：agents.defaults）に入れます。まずは「TTL付きで有効化」だけ覚えればOKです。

{
  agents: {
    defaults: {
      contextPruning: {
        mode: "cache-ttl",
        ttl: "5m",
      },
    },
  },
}

ここはこういう意味：「最後にAIを呼んでから5分以上空いたら、次の呼び出し直前に“古いツール結果”を整理する」設定です。

もし「特定のツールだけ整理したい」なら、許可/拒否（allow/deny）で絞れます。ただし最初は、困ったときに絞るくらいで十分です。

よくある不安：プルーニングすると賢さが落ちない？

可能性はあります。なぜなら、ツール結果の中に「推論に必要な根拠」が入っていることがあるからです。ただ、Session Pruningは“ユーザー/アシスタントの会話本文は残す”前提なので、「会話の目的」や「やりたいこと」は比較的残りやすい設計です。

対策としては、重要な情報は（1）会話本文として短く言い直す、（2）別の保存先（メモ/DB/記事）に残す、のどちらかが堅いです。

まとめ

Session Pruningは、長い会話で増えたツール結果を、モデルに送る直前に整理する仕組み
特に「しばらく止まった後の再開」で、キャッシュ再作成のムダを減らしやすい
最初は mode: cache-ttl + ttl から始めると迷わない

参考

https://docs.openclaw.ai/concepts/session-pruning.md

#ガイド

BizClaw 導入支援

OpenClaw の構築を
まるごと代行します

Mac mini のセットアップから Slack・iMessage 連携まで、届いた日から使える状態でお届けします。

サービスを見る

AIエージェントのメモリスタックとは？2026年に重要度が上がる理由をやさしく解説

2026年4月8日

OpenClaw vs Hermes vs Claude、創業者はどれを選ぶべき？2026年版の実務比較

2026年4月8日

X公式MCPサーバーとは？AIエージェント運用で何が変わるのかを実務目線で解説

2026年4月8日

【最新版】OpenClawのセッションプルーニング（Session Pruning）とは？初心者向けにやさしく解説

この記事の要点（TL;DR）

次に聞くべき質問3つ

Session Pruning（セッションプルーニング）とは？

いつ動くの？（重要：TTLとキャッシュの関係）

何が削られる？何が削られない？

Soft（やさしく）と Hard（バッサリ）の2段階

初心者向け：最小の設定例（考え方付き）

よくある不安：プルーニングすると賢さが落ちない？

まとめ

参考

OpenClaw の構築をまるごと代行します

関連記事

AIエージェントのメモリスタックとは？2026年に重要度が上がる理由をやさしく解説

OpenClaw vs Hermes vs Claude、創業者はどれを選ぶべき？2026年版の実務比較

X公式MCPサーバーとは？AIエージェント運用で何が変わるのかを実務目線で解説

OpenClaw の構築を
まるごと代行します