24/7 稼働の macOS Mac mini 上で OpenClaw ゲートウェイを長く回すと、表計算の前提より速く文脈が膨らみます。Slack のスレッドごとにツールの標準出力が連結され、失敗したコマンドのリトライは冗長な標準エラー付きで戻り、添付プレビューは会話状態の中に base64 の塊を増やします。三週目あたりから、CPU が 45% を超えないのに p95 の応答首トークンまでの時間が 8 秒を超える、というパターンはモデルが重いのではなく、ベンダーがメガバイト級の重複テキストを毎ターン飲み込んでいるサインです。本稿では 会話メモリのプルーニング、ツール出力の上限、プロバイダ制限に揃えたターン単位のトークン天井、そして変更方針を実機でリハーサルする手順をまとめます。併読として トークン予算とツール制限、JSON と環境プロファイルの衛生、ゲートウェイ doctor 診断 をセットにすると、プルーニングが認証やルーティング表と衝突しにくくなります。
判断用のマトリクス、監査を通りやすい数値の出発点(トークン上限、保持ウィンドウ、ログローテーションサイズ)、macOS 特有の落とし穴、プラットフォームエンジニア向けの FAQ を持ち帰れる構成にしました。
メモリがボトルネックであるシグナル
CPU と GPU が低いまま首トークンまでの時間だけ伸びるのは、プロンプト過大が典型です。もう一つの兆候は、ゲートウェイがスレッド全体を 90 秒 ごとにスナップショットしてディスク書き込みが周期性に尖ること——アイドルチャネルでもコストが積み上がります。
経営と共有しやすいカウンターは次の四つです。ターンあたり平均プロンプトトークン、時間あたりに付与されたツール標準出力バイト、ルートボリュームの空き率、そして「以前の判断を忘れた」タグの再オープンチケット。この四系列が無いとプルーニング変更が効いたか証明できません。
インシデント時は機能追加を凍結し、重複ツールペイロードを示す編集済みトランスクリプトをスナップショットしてから、直近の要約ロジック変更をロールバックします。
「一時的に保持だけ上げる」緊急措置はチケット ID とセットで文書化しないと、ローンチ中にプルーニングが黙って無効化され、月次請求が倍になる原因になります。
サポートでは、遅延が「その日最初のメッセージ」だけか「長いスレッドの途中から」かを切り分けてください。前者はコールドスタート設定の疑い、後者はプルーニング不足の疑いです。
マトリクス:要約とハード切り詰め
| 戦略 | 品質 | コスト | リスク |
|---|---|---|---|
| N ターンごとの LLM 要約 | 連続性が高い | 追加のモデル呼び出し | コンプラ上重要な数値を落とす可能性 |
| ピン留めしたシステム事実付きハード切り詰め | 安価 | トークンオーバーヘッドが低い | ピンが薄いと「忘れた」と感じられる |
| ハイブリッド:ツールノイズだけ要約 | バランス型 | 中程度 | スキーマ意識のある編集が必要 |
2026 年現在、多くのチームで現実的なのはハイブリッドです。ユーザーの決定とチケット ID は逐語で残し、シェルログなど騒がしいツール出力は 4 KiB を超えたら圧縮します。
監査に耐える数値の初期値
最初のつまみとして、ユーザーに見える直近 30 ターンは逐語のまま残し、それより古い内容は 900 トークン以下の箇条書きメモに要約、単一ツールの添付プレビューは base64 化の前に 64 KiB で拒否、空きディスクが 12% を下回ったら新しい添付を断る、というセットが現場で通りやすいです。
要約ジョブの同時実行は 3 ワーカーまでに抑え、要約そのものがインタラクティブ応答を餓死させないようにします。
プロバイダのメンテナンス告知がある日は、開始 15 分 前から要約頻度を 50% 下げ、ベンダ側ブラウンアウトと圧縮ジョブの重なりを避けます。
200 ターン のリプレイファイルでレッドチームし、ピン留めしたコンプラ事実が 2% を超えるセッションで落ちるなら要約プロンプトがまだ漏れています。
プルーニング定数は Git で版管理し、オンコールがインシデント当時の生きた値を推測しないようにします。
macOS のディスク、LaunchAgent、ログ
launchd ジョブが冗長なトランスクリプトを ~/Library/Logs に書き続けると、Linux の ext4 チームが想定するより速く APFS コンテナを圧迫します。ファイル 256 MB ローテーション、世代 5 本、を出発点にしてください。
プルーニングとローカル fork 上限はセットです。スロットルガイド の並行度キャップで、要約ワーカーが無限 fork しないようにします。
ハード調達が遅れる場合はクラウド Mac mini で圧縮をリハーサルします。MacHTML の Apple Silicon は多くの場合 日 $16.9 前後から、SSH/VNC でディスクとレイテンシの生ログを採れます。
プルーニング定数を変えたあとはゲートウェイの LaunchAgent を再起動し、JSON と環境プロファイル に書いた各 plist パスへ環境変数が揃ったか確認します。
デプロイ後は doctor プローブ で RPC 健全性を見てから圧縮ロールアウト完了と宣言します。
プルーニング中のチャネル UX
Slack や Teams では、理由が分かる要約なら圧縮は受け入れられやすいです。生トークンを 40% 以上削ったら定型文を出し、保持ポリシーへの内部 FAQ をリンクします。
「無限の記憶」というプロダクト要望は、明示的な予算に翻訳してください。週平均で 1,000 追加プロンプトトークンあたりのドル換算を見せ、要約を生き残らせるピン留め事実ブロックを提案すると、社内調査では満足度を大きく落とさず月額 18~28% 下げた例が報告されています。
外向きボットでは、圧縮のあと短い「記憶を更新しました」行を入れ、長い法的免責が再確認を要する場面を明示します。
プルーニング後に生のツール標準エラーをチャネルへエコーしないでください。編集したつもりの秘密が蘇る経路になります。
多言語ワークスペースではワークスペースのロケールヘッダに合わせて要約通知をローカライズします。
要約ジョブ中にクライアントがタイピング表示をスパムしないよう抑え、プロバイダ負荷を増幅しないようにします。
テレメトリと経営に伝わる指標
プルーニング前後でプロンプトトークン数のヒストグラムを吐き出し、差が 25% 未満なら要約が静かに失敗している可能性が高いです。
各圧縮実行に要約プロンプトの Git SHA をタグし、請求のスパイクをベンダのせいにする前にプロンプト編集と相関させられます。週次で 12% を超える増加なら 48 時間 以内にブレイムレスレビューを開き、生ログが残っているうちに原因を切ります。
空きディスク 15% を 10 分 超えて下回ったらインフラへページし、圧縮の途中で書き込みが止まる前に対処します。
ユーザー メッセージと圧縮バージョンを相関 ID で結んだ構造化監査ログを 90 日 保持します。
「初回回答で解決した率」をプロンプトトークン平均と並べてダッシュボード化し、レイテンシだけ最適化してコストが爆発するのを防ぎます。
四半期ごとに最長スレッドを 35 件手で見てください。自動バケツはベンダ遅延をローカルメモリ不具合と誤ラベルしがちです。
文脈削除時のセキュリティ
圧縮マーカーと一緒にプロンプト全文をログに残さないでください。インシデントバンドルにはハッシュ化した会話 ID のみを載せます。深夜三時のデバッグダンプからも API キーを編集してください。
GDPR や SOC2 の監査では、破壊的プルーニング前にユーザーへ通知した証跡を求められます。バナーと同意タイムスタンプを圧縮ジョブと同じ監査インデックスに置きます。
漏えいが疑われたら共有プロバイダキーを回し、新しいキーが全 LaunchAgent plist に行き渡るまで要約の並行度を一時的に絞ります。
「今すぐ要約」エンドポイントをペンテストで叩かれても、認証とレート制限が効き CPU 枯渇に転ばないか確認します。
最後にフェイルオーバーを演習します。ディスク上のスレッドストアをスナップショットし、圧縮の途中書き込み失敗をシミュレートし、ゲートウェイが部分的に切り詰めた履歴を配信せず起動を拒否できるか検証します。これだけで「夜間デプロイ後に回答が食い違う」最悪クラスのチケットを防げます。
よくある質問
プルーニングはメッセージごとと時間ごと、どちらですか?
ホットチャネルはメッセージ単位、静かなワークスペースは時間単位が無難です。
プルーニングはスロットルの代替になりますか?
いいえ。二層を併用します。
物理 Mac mini でリハーサルする理由は?
macOS のスケジューリング、ディスク圧迫、Keychain の挙動は Linux CI だけでは揃いません。
Apple Silicon Mac mini は、OpenClaw のメモリ方針を本番に近い形で試す最も忠実な舞台です。長時間キャプチャのサーマル、ログローテーションの実ファイルシステム挙動、LaunchAgent のタイミングがそのまま再現されます。MacHTML のクラウド Mac mini は SSH/VNC 付きで、プルーニング・スロットル・doctor 検証を別の CapEx なしに回せます。演習のために確保し、証拠が揃ったら解放する運用が現実的です。
クラウド Mac mini で OpenClaw メモリ方針をリハーサル
Apple Silicon をレンタルし、トランスクリプトの刈り込み、ディスクローテーション、ゲートウェイ doctor を実 macOS で検証できます。