セッションプルーニングのイメージ(古いツール結果を整理する)

【最新版】OpenClawのセッションプルーニング(Session Pruning)とは?初心者向けにやさしく解説

この記事の要点(TL;DR)

  • 結論: Session Pruningは古い「ツールの実行結果」だけを、モデルに送る直前の文脈から間引く仕組みです(ディスク上の履歴を書き換えるわけではありません)。
  • うれしい点: セッションがしばらく止まった後の再開1発目のコスト(cacheWrite)を下げやすく、キャッシュの挙動も安定します。
  • 初心者の落とし穴: 「会話が要約される」ではなく、あくまでツール結果の整理。ユーザー/アシスタントの発言は基本そのままです。

次に聞くべき質問3つ

  • 自分の運用は「頻繁に会話する」?それとも「たまに再開する」?(ttlの決め方が変わる)
  • どのツールの結果が長くなりがち?(read/exec/web_fetchなど)
  • “消えたら困る情報”はツール結果に入ってない?(必要なら保存先を変える/短くする)

Session Pruning(セッションプルーニング)とは?

OpenClawで会話(セッション)を続けていると、途中でツール(readweb_fetch など)を何度も使います。 その結果が長いと、次にAIへ投げる「会話の材料(コンテキスト)」が太って、料金や速度に影響が出やすくなります。

そこで出てくるのがSession Pruning。 これは“次の1回のAI呼び出しに送る文脈”を軽くするために、古いツール結果を整理する機能です。

ここはこういう意味:「履歴を削除する」のではなく、そのリクエストでモデルに見せる情報を一時的に減らすイメージです。 セッションの保存ファイル(*.jsonl)自体は書き換えません。

いつ動くの?(重要:TTLとキャッシュの関係)

Session Pruningは、特に「しばらく会話が止まった後」に効いてきます。 OpenClawのドキュメントでは、mode: cache-ttl を有効にして、最後の対象モデル呼び出しから ttl を超えたときに実行される、と説明されています。

イメージ:「しばらく使ってなかったノートを開き直すとき、前のページに貼った長い資料(ツール結果)だけを“いったん外して”軽くしてから再開する」感じ。 すると再開1回目に“全部貼り直す”コストが減りやすい、という考え方です。

何が削られる?何が削られない?

  • 対象になりうる: toolResult(ツールの実行結果)のみ
  • 基本そのまま: ユーザーの発言/アシスタントの発言(会話の本文)は変更されない
  • 保護される範囲: 直近の一定数のアシスタント発言(keepLastAssistants)は守られる
  • 画像を含む結果: 画像ブロック入りのツール結果はスキップ(= 触らない)

ここはこういう意味:「会話の流れ」はできるだけ保って、重くなりがちな“添付資料(ツール結果)”だけを整理する設計です。

Soft(やさしく)と Hard(バッサリ)の2段階

ドキュメントでは、プルーニングのやり方が2種類に分かれています。

  • Soft-trim: 長すぎるツール結果を「先頭+末尾だけ残す」形で短くする(途中は ... みたいに省略)
  • Hard-clear: ツール結果を丸ごと置き換えて、[Old tool result content cleared] のようなプレースホルダーにする

イメージ:Softは「重要そうな見出しと結論だけ残す」、Hardは「資料が邪魔なので“資料は消しました”メモだけ残す」です。

初心者向け:最小の設定例(考え方付き)

設定はGatewayのコンフィグ(例:agents.defaults)に入れます。 まずは「TTL付きで有効化」だけ覚えればOKです。

{
  agents: {
    defaults: {
      contextPruning: {
        mode: "cache-ttl",
        ttl: "5m",
      },
    },
  },
}

ここはこういう意味:「最後にAIを呼んでから5分以上空いたら、次の呼び出し直前に“古いツール結果”を整理する」設定です。

もし「特定のツールだけ整理したい」なら、許可/拒否(allow/deny)で絞れます。 ただし最初は、困ったときに絞るくらいで十分です。

よくある不安:プルーニングすると賢さが落ちない?

可能性はあります。なぜなら、ツール結果の中に「推論に必要な根拠」が入っていることがあるからです。 ただ、Session Pruningは“ユーザー/アシスタントの会話本文は残す”前提なので、 「会話の目的」や「やりたいこと」は比較的残りやすい設計です。

対策としては、重要な情報は(1)会話本文として短く言い直す、(2)別の保存先(メモ/DB/記事)に残す、のどちらかが堅いです。

まとめ

  • Session Pruningは、長い会話で増えたツール結果を、モデルに送る直前に整理する仕組み
  • 特に「しばらく止まった後の再開」で、キャッシュ再作成のムダを減らしやすい
  • 最初は mode: cache-ttl + ttl から始めると迷わない

参考

BizClaw 導入支援

OpenClaw の構築を
まるごと代行します

Mac mini のセットアップから Slack・iMessage 連携まで、届いた日から使える状態でお届けします。

サービスを見る

関連記事

Read article
AIエージェントのメモリスタックとは?2026年に重要度が上がる理由をやさしく解説

AIエージェントのメモリスタックとは?2026年に重要度が上がる理由をやさしく解説

Read article
OpenClaw vs Hermes vs Claude、創業者はどれを選ぶべき?2026年版の実務比較

OpenClaw vs Hermes vs Claude、創業者はどれを選ぶべき?2026年版の実務比較

Read article
X公式MCPサーバーとは?AIエージェント運用で何が変わるのかを実務目線で解説

X公式MCPサーバーとは?AIエージェント運用で何が変わるのかを実務目線で解説