請求が急増したとき最初に触るつまみは？

アシスタント各ターンの最大出力トークンを下げ、どのツールが最も太いプロンプトを生成するか確認できるまで並列ツール呼び出しを無効化する。その後ログを見ながら段階的に再有効化する。

ゲートウェイを落とさず暴走ループを止めるには？

会話ごとのステップ予算と壁時計タイムアウトを導入し、超過時は黙って再試行せず、チャネルへ構造化エラーを返す。

なぜ専用 Mac mini で制限を試すのか？

プロセス fork、ファイルウォッチャ、LaunchAgent 再起動の挙動は Linux コンテナと異なる。クラウド Mac mini は本番 macOS のスケジューリングに近い。

2026年版 OpenClaw：トークン予算とツール制限 — クラウド Mac ゲートウェイ運用

OpenClaw のゲートウェイは体験が軽やかに感じる一方で、エージェントがシェル調査を短い間隔で連鎖させ、毎ターン巨大なログを読み直し、数千トークンの「思考」前置きを流し続けると、財務から週末だけで推論予算が3倍を超えたと詰められる現実に直面します。本稿は、24時間365日稼働の macOS ホスト（多くの場合は共有の Mac mini）で OpenClaw を運用し、スローガンではなく具体的な制限値が欲しいチーム向けの実務ノートです。チャネル再試行の陰に潜む不具合を切り分けるときは、OpenClaw doctor とゲートウェイ診断（日本語版）と併読すると、症状と設定の対応が早くなります。

ここでは「制限が弱すぎるサイン」、ハード上限と適応キューの比較表、監査に耐える初期数値、LaunchAgent や fork 圧力と絡む macOS 固有の論点、ログに溺れない観測性、そしてプラットフォーム責任者向けの FAQ をまとめます。デモ用の短い設定例ではなく、週次レビューで数字を説明できる粒度を意識しました。

制限が弱いときの兆候

レイテンシがほぼ直線的に伸びるのにゲートウェイの CPU が遊んでいるときは、多くの場合モデル事業者側でレート制限待ちに並んでいおり、Swift のパーサが突然遅くなったわけではありません。別の兆候として、ツール出力をメモ化していないためにワークスペース全体を何秒おきかで再シリアライズし、ディスク書き込みが周期的に跳ね上がるパターンがあります。さらにチャネル層で、400ミリ秒以内に同一の「作業中」返信が二重に届くなら重複排除が欠落しており、静かにトークン消費が倍加しています。

財務と共有すべき最小セットは、成功タスクあたりトークン、失敗タスクあたりトークン、会話あたりツール起動回数、チケット解決までの壁時計時間の四系列です。この四つが無い限り、モデル更新が効いたのか制限が緩んだのかを証明できません。

インシデント時は機能追加を凍結し、まず ~/.openclaw をスナップショット（秘密はマスク）し、直近のポリシー差分を巻き戻します。スナップショットを取らないチームは、モデル経路の問題なのかサンドボックス変更なのかを何日も推測することになります。

「非常口」用の資格情報ローテーション手順も文書化してください。認証エラーが多発するとクライアントが攻撃的に再試行し、制限が実質的に開放されることがあります。

サポートエンジニア向けに、リリースタグごとに有効だった制限値を一枚にまとめたチートシートを用意しましょう。ページャ嵐の最中に Git 履歴だけを辿るのは現実的ではありません。

運用では「体感が遅い」よりも、トークン単価と解決件数の商が悪化しているかを先に見ます。体感はネットワーク揺らぎやクライアント側 UI の問題と混ざるため、意思決定の主軸に据えない方が安全です。

また、社内チャットに貼られるログ断片は往々にして古いビルドの出力です。相関 ID を必須フィールドにして、どのゲートウェイ実体のどのポリシー版かを一発で辿れるようにしてください。

方針マトリクス：固定上限と適応キュー

アプローチ	向いている場面	リスク	運用負荷
最大出力トークンの固定上限	外向きボット	回答が思考の途中で切れる	低
ツール単位の遅延予算	ファイル巡回	正当な深い探索が失敗する	中
適応的なキュー深さ	SLO を持つ社内向け	チューニングが複雑	高
会話ステップ上限	調査エージェント	利用者が手動で再開が必要	低

多くの本番チームは、財務説明が容易で監査にも強い 最大出力トークンの固定上限 と 会話ステップ上限 を併用します。適応キューは、最低でも六週間のベースライン指標が溜まってからです。

表の「リスク」欄は製品側のトレードオフであり、インフラだけの話ではありません。上限が厳しすぎると利用者は回避行動を取り、別チャネルから同じ作業を二重に走らせてトークンを増やすことさえあります。

監査に通る初期値

以下は、16GB メモリの Mac mini で同時オペレータが二十名未満のシングルテナント構成を想定した保守的な出発点です。

最大出力トークン： 日常業務は 900〜1200。コード生成ルートだけ 1800 に上げる場合は機能フラグの背後に置く。
ツール並列： シェルは 1、読み取り専用のファイル stat は 2、ネットワークは明示許可リストがある場合以外は 0。
バックオフ： 初期待機 2秒、再試行ごとに 1.8倍、上限 45秒、最大 5回で人が読めるエラーを返す。
会話あたり壁時計： オペレータが continue と入力しない限りモデル時間 12分 で強制停止。無限の「もう一度確認します」ループを防ぐ。

上限を引き上げるのはパーセンタイル根拠があるときだけにし、p95 レイテンシが目標内に収まることを確認したら、モニタ閾値の変更と同じコミットに記録を残します。

ブラウザ自動化ツールを併用する場合は、スクリーンショットがプロンプトを肥大化させるためトークン予算を概ね 2.5分の1 に割り、DOM 専用ツールを安価な経路に寄せます。

各完了イベントには有効ポリシー版の文字列を必ずログに載せ、Grafana でデプロイ前後を推測不要に分割できるようにします。

セキュリティ上の注意として、数値制限はサンドボックスの代替ではありません。ディレクトリ許可リストとコマンド接頭辞の四半期レビューをセットで回してください。

さらに、ツールのタイムアウトとモデル側のタイムアウトを一致させないと、片方だけが先に切れて再試行が雪だるま式に増える罠があります。どちらが「正」の期限かを運用ドキュメントに固定しましょう。

macOS のスケジューリング、LaunchAgent、fork 負荷

OpenClaw はファイルウォッチャ、ログシッパー、場合によっては Xcode 由来のシミュレータと共存します。負荷下では fork 偏重のツールチェーンが CPU が余裕でもメモリ圧迫に陥り、壁時計時間が伸びます。同時会話が 3件を超えるならシェル系ツールは直列化し、フェアスケジューリングによるインタリーブを避けてツール呼び出し単位のばらつきを抑えます。

LaunchAgent では失敗時の再起動に ThrottleInterval を入れ、障害中にモデル API を 10Hz で叩くタイトループを避けます。再起動手順にはステータスチャネルへのリンクを添え、人間が状況を共有できるようにします。

fork ストームを手元で再現できない場合は、本番の RAM と macOS マイナー版に近い クラウド Mac mini を借りて検証するのが近道です。MacHTML の料金は短時間バーストで 1日あたり約16.9ドル 程度に収まることが多く、シニアエンジニアの週末を推測に費やすより安価です。

攻撃的な制限テストの前にゲートウェイの plist と環境ファイルをスナップショットし、ロールバックは launchctl bootout とリストアの一発で済むようにします。

ファンレス構成の mini は全コア連続バースト後に熱制御で CPU が落ち、トークン方針が不変でもレイテンシ分布が変わります。データセンターの室温と吸気方向まで含めてメモしておくと後追いが楽です。

日本語チームでは「開発用 MacBook と本番 mini の差」を軽視しがちですが、ファイルシステムの大文字小文字の扱いやパス長、Spotlight の索引負荷など、細部がツール失敗率に効きます。クラウド Mac で本番に寄せた検証を週次で回すと改善が安定します。

ログに埋もれない観測性

ツール起動ごとに一行の JSON を出し、conversation_id、tool、duration_ms、exit_code、retry_count、policy_version を揃えます。保存先は既存の安価ストアで構いません。OpenSearch、ClickHouse、あるいはボリュームが小さければ S3 と Athena でもよいでしょう。

成功解決あたりトークンの移動平均が過去七日比 20% を超えたらアラート。プロンプトテンプレの微修正が静かに回帰を起こす典型パターンを拾えます。

ダッシュボードにはモデル経路別のトークン積み上げ面グラフと、曜日×時間の失敗ヒートマップを載せましょう。マーケ施策でトラフィックが跳ねたときに制限の穴が露呈します。

秘密のマスキングは表示時だけでなく取り込み時に行います。制限付き再試行はログ量を増やし、デバッグ束をコピーした瞬間にトークンが漏れる事故を招きます。

週次のゲームデイではステージングだけ最大出力を 30% 下げ、ゴールデンパスが通るか検証し、得られた教訓を本番設定へ昇格させます。

オンコール手順は三段階で固定します。(1) トークン上限を下げチャネルに通知、(2) 非必須ツールを止め冷スタンバイへ迂回、(3) 財務承認付きの緊急枠まで増やすまでメンテ表示で閉じる。四半期ごとに演習すると、地域全体が 429 のときに即興を減らせます。

プロダクト文言も現実と揃えてください。トップが「無制限調査」を謳うと、制限は常にバグに見え、サポート工数が跳ね上がります。価格の隣に正直な上限を掲げると問い合わせが減ります。

エンジニアリングマネージャは、プロンプト変更と制限差分を同一 PR に載せる運用を推奨します。分離すると「謎のトークン急増」が実はコピー調整であることが後から判明し、原因分析が長引きます。

最後に、OpenClaw のゲートウェイは単体では完結しません。チャネル側の再送、リバースプロキシのタイムアウト、DNS の失敗が重なると、モデル以前にトークンが浪費されます。ネットワーク境界のメトリクスも同じボードに載せてください。

FAQ

請求が跳ねたとき最初のつまみは？

最大出力トークンを下げ、ログで犯人が分かるまで並列ツールを止めます。

ゲートウェイを殺さずループを止めるには？

ステップ上限と壁時計上限を設け、無限再試行の代わりに明示エラーを返します。

なぜ専用 Mac mini で試すのか？

本番に近い macOS のプロセス挙動を再現でき、Linux スタブでは隠れる fork とウォッチャ相互作用を捉えられます。

Apple Silicon Mac mini は、ローカルモデルとゲートウェイのオーバーヘッドをまとめて載せられる統合メモリ、オフィスラック向けの静音性、デザイナが VNC で再現する際の期待値一致、という三点で依然としてスイートスポットです。MacHTML は SSH と VNC 付きの Mac mini を提供するため、制限値の検証、LaunchAgent リカバリ、doctor ワークフローを実機で回し、負荷試験が終わればすぐ縮小できます。

ターン制限に上流圧縮を重ねる——OpenClaw + Headroom プロキシ手順（localhost:8787）を参照。

クラウド Mac mini で OpenClaw の制限を試す

トークン上限、ツール直列化、LaunchAgent リカバリを Apple Silicon 上で素早く検証。自動化は SSH、対話確認は VNC。

Mac mini プランを見る SSH と VNC のセットアップ