Die nächtlichen Repo-Audits von OpenClaw rufen Linter, Test-Runner und grep-Fluten auf, die Megabytes an JSON in den Modellkontext zurückgeben. Für jedes rohe Byte den Anthropic-Listenpreis zu zahlen, macht aus disziplinierter Automatisierung einen vierstelligen API-Kostenposten. Headroom sitzt zwischen Gateway und Anbieter: ein lokaler Proxy auf Port 8787 (Standard), der Tool-Ausgaben, Logs und Verlauf mit SmartCrusher / CodeCompressor / CCR komprimiert, bevor Anfragen api.anthropic.com erreichen. Veröffentlichte Benchmarks zeigen 92 % Token-Reduktion bei SRE-artigen Traces und 73–92 % bei Codesuch-Workloads — dieser Leitfaden zielt auf 60–80 %+ Einsparung bei tool-lastigen Turns, ohne Ihr Skill-Markdown zu ändern.
Kombinieren Sie dies mit den Ausgaben-Wächtern aus unserem Leitfaden OpenClaw-Tokenbudgets und Tool-Throttles und der Gateway-Planung in LaunchAgents vs. cron auf macOS. Geheimnis-Hygiene steht in openclaw.json- und .env-Profilen.
Offenlegung: MacHTML bietet optional die Miete eines Cloud-Mac-mini für Staging-Gateways an; dieses Runbook ist herstellerneutral und funktioniert auf jedem macOS-Host.
Warum OpenClaw + Headroom ein einzigartiger Stack ist
OpenClaw glänzt bei dauerhaft laufenden Gateways: Slack/Telegram-Eingang, Tool-Allowlists und mehrstufige Skills, die riesige Workspace-Bäume erneut lesen. Headroom glänzt bei der Kontextkompression — nicht Ihre Absicht zusammenfassend, sondern verkleinernd, was Tools zurückgeben. Die Kombination ist selten, weil die meisten Teams nur einen Hebel wählen:
| Hebel | Was er kürzt | Blinder Fleck |
|---|---|---|
| Nur OpenClaw-Throttles | Turn-Anzahl, Nebenläufigkeit | Verschickt 50 KB Linter-JSON weiterhin wörtlich |
| Nur kleineres Modell | Ein-/Ausgabe-$/Token | Übersieht Befunde bei komplexen Audits |
| Manuelles Log-Kürzen in Skills | Ad-hoc | Bricht Reproduzierbarkeit über cron-Läufe |
| Headroom-Proxy + OpenClaw | Tool-/RAG-/Log-Token vor dem Anbieter | Erfordert lokalen Python-3.10+-Prozess |
Headrooms README führt OpenClaw als erstklassige Integration auf (ContextEngine-Plugin-Pfad plus generischer OpenAI-kompatibler Proxy). Sie behalten OpenClaws Orchestrierung; Headroom schreibt die Form der Nutzlast um, die das Modell sieht.
Externe Referenzen: Headroom GitHub, Headroom-Proxy-Doku, Anthropic-API.
Architektur: Gateway → Proxy → Anthropic
┌─────────────┐ HTTP/SSE ┌──────────────────────┐ HTTPS ┌─────────────────┐
│ OpenClaw │ ────────────► │ Headroom proxy │ ────────► │ api.anthropic.com│
│ gateway │ 127.0.0.1:8787│ SmartCrusher + CCR │ │ (real API key) │
│ :8788 tools │ │ /v1/messages │ └─────────────────┘
└─────────────┘ └──────────────────────┘
▲ │
│ tool stdout/json │ headroom_retrieve if model needs originals
└──────────────────────────────┘
Routing-Regel: OpenClaw liest die Basis-URLs der Anbieter aus der Umgebung (~/.openclaw/.env) und openclaw.json. Lenken Sie Anthropic-Verkehr auf Headroom, nicht auf den öffentlichen Endpunkt. Headroom leitet mit Ihrem echten ANTHROPIC_API_KEY aus der Proxy-Prozessumgebung weiter — OpenClaw kann dieselbe Schlüsselvariable behalten, aber der Host muss lokal sein.
Port-Disziplin: Der Headroom-Proxy bindet standardmäßig 8787 — derselbe Port, den viele OpenClaw-Gateway-Beispiele nutzen. Betreiben Sie in Produktion Headroom auf 8787 und verschieben Sie das OpenClaw-Gateway auf 8788 (oder umgekehrt). Dokumentieren Sie das Paar in Ihren LaunchAgent-Plists.
Schritt-für-Schritt-Runbook (macOS 2026)
1. Headroom mit Proxy-Extras installieren
python3 --version # must be 3.10+
pip install "headroom-ai[proxy]"
headroom --version
Auf Apple Silicon ist pip install "headroom-ai[all]" in Ordnung, wenn der Platz reicht; nur Proxy hält die Images kleiner.
2. Proxy mit Logging und Statistiken starten
export ANTHROPIC_API_KEY="sk-ant-..." # real key — proxy forwards upstream
headroom proxy \
--host 127.0.0.1 \
--port 8787 \
--log-file ~/.headroom/openclaw-proxy.jsonl
Zustand prüfen:
curl -s http://127.0.0.1:8787/health | python3 -m json.tool
curl -s http://127.0.0.1:8787/stats | python3 -m json.tool
Sie wollen optimize: true und ein wachsendes tokens_saved nach Testverkehr.
3. OpenClaws Anthropic-Aufrufe über den Proxy leiten
Bearbeiten Sie ~/.openclaw/.env (chmod 600):
ANTHROPIC_API_KEY=sk-ant-...
ANTHROPIC_BASE_URL=http://127.0.0.1:8787
# If you use OpenAI-compatible models in the same gateway:
# OPENAI_BASE_URL=http://127.0.0.1:8787/v1
Stellen Sie sicher, dass OpenClaw die env vor dem Gateway-Start auflöst — siehe JSON- und .env-Profile. Committen Sie diese Zeilen nicht.
4. OpenClaw-Gateway bei Bedarf von Port 8787 verschieben
Setzen Sie in ~/.openclaw/openclaw.json den Gateway-Listen-Port auf 8788, wenn Headroom 8787 belegt:
{
"gateway": {
"port": 8788,
"host": "127.0.0.1"
}
}
Starten Sie das Gateway neu; Health-Probes müssen auf 8788 zielen, nicht auf den Headroom-Port.
5. Optional — nativer Headroom-OpenClaw-Plugin-Pfad
Headroom dokumentiert OpenClaw als ContextEngine-Plugin (headroom/providers/openclaw). Wenn Sie den Plugin-Modus der rohen Basis-URL vorziehen:
pip install "headroom-ai[all]"
headroom wrap openclaw # when available in your installed version
Fehlt wrap openclaw, bleiben Sie bei proxy + ANTHROPIC_BASE_URL — das ist laut Proxy-Doku der unterstützte universelle Pfad.
6. Kompression mit einer großen Tool-Nutzlast rauchtesten
Lösen Sie einen Skill aus, der großes JSON zurückgibt (Testausgabe oder find-Ergebnisse). Vergleichen Sie:
curl -s http://127.0.0.1:8787/stats | python3 -m json.tool
tail -n 5 ~/.headroom/openclaw-proxy.jsonl
Ziel: savings_percent strebt beim ersten echten Audit gegen ≥40 %; tool-lastige Nächte überschreiten oft 60–80 %.
7. Headroom unter launchd verstetigen (parallel zu OpenClaw)
Erstellen Sie ~/Library/LaunchAgents/ai.headroom.proxy.plist mit ProgramArguments, die headroom proxy --host 127.0.0.1 --port 8787 aufrufen, EnvironmentVariables für ANTHROPIC_API_KEY und einem StandardOutPath unter ~/.headroom/logs/. Laden Sie sie vor ai.openclaw.gateway, damit die Basis-URL beim Gateway-Start aufgelöst wird — Muster im LaunchAgent-cron-Leitfaden.
8. MCP-/Claude-Code-Sidecars anbinden (optional)
Headroom stellt MCP-Tools bereit (headroom_compress, headroom_retrieve, headroom_stats). Für Claude-Code-Sandboxes, die OpenClaw-Skills versorgen, installieren Sie MCP einmal:
headroom mcp install
OpenClaw-Skills können denselben Kompressions-Statistik-Endpunkt unter http://127.0.0.1:8787/stats für Dashboards aufrufen.
9. Budget-Leitplanken am Proxy setzen
headroom proxy --port 8787 --budget 50.0 --log-file ~/.headroom/openclaw-proxy.jsonl
--budget 50.0 setzt eine tägliche USD-Obergrenze in Headroom — eine Ergänzung, kein Ersatz für OpenClaws Pro-Turn-Throttles.
10. Mit openclaw doctor validieren
openclaw doctor
doctor sollte das Gateway als gesund auf 8788, den Anbieter über 127.0.0.1:8787 erreichbar und keinen doppelten Port-Bind (EADDRINUSE) zeigen.
Muster der nächtlichen Audit-Pipeline
Typischerweise löst ein cron oder LaunchAgent um 02:00 lokal einen OpenClaw-Skill aus:
git fetch --allund Diff gegenmainnpm test/eslint/ eigenes Audit-Skript über erlaubte Tools ausführen- Zusammenfassung in Slack posten
Ohne Headroom injiziert Schritt 2 oft 15k–65k Token stderr (veröffentlichter SRE-Benchmark: 65.694 → 5.118 Token). Mit Proxy-Kompression bleibt dieselbe FATAL-Zeile über CCR-Abruf auffindbar, wenn das Modell Originale anfordert.
Zitierfähig: OpenClaws Anthropic-Verkehr über Headroom auf 127.0.0.1:8787 zu leiten, kann tool-lastigen Kontext um 60–92 % reduzieren und dabei über CCR die Umkehrbarkeit bewahren — als Ergänzung zu OpenClaw-Throttles zur Ausgabenkontrolle, nicht als Ersatz.
Vergleichen Sie die Harness-Optionen in Hermes vs. OpenClaw, wenn Sie Speicherkompression von Tool-Kompression auf HTTP-Ebene trennen.
Fehlerbehebung
Gateway liefert 502 / Verbindung verweigert beim Chat
Muster: OpenClaw-Logs zeigen direkt nach Aktivierung des Proxys Upstream-Fehler.
Lösung: Prüfen Sie, ob Headroom lauscht (curl http://127.0.0.1:8787/health). Wenn Gateway und Proxy beide 8787 versuchten, trennen Sie die Ports (Schritt 4). Laden Sie die LaunchAgents in Reihenfolge neu: zuerst Headroom, dann OpenClaw.
Einsparungen bleiben in /stats nahe 0 %
Muster: tokens_saved bleibt flach; transforms leer.
Lösung: Stellen Sie sicher, dass der Verkehr wirklich durch den Proxy fließt — ANTHROPIC_BASE_URL muss in der Prozessumgebung des Gateways gesetzt sein, nicht nur in Ihrer interaktiven Shell. Zum Passthrough-Debuggen führen Sie vorübergehend headroom proxy --no-optimize aus und vergleichen. Große Nutzlasten müssen Tool-/Nachrichtenkörper sein, keine winzigen Prompts.
Modell „verliert“ Stacktrace-Details
Muster: Der komprimierte Turn lässt Zeilennummern weg, die Auditoren erwarten.
Lösung: Headroom CCR speichert Originale lokal; ergänzen Sie Skill-Text, der headroom_retrieve erlaubt, oder setzen Sie x-headroom-bypass: true für einen Diagnose-Turn. Deaktivieren Sie die Kompression nicht global für nächtliche Läufe — korrigieren Sie stattdessen die Abrufrichtlinie.
EMFILE oder CPU-Spitze auf dem Mac mini
Muster: Gleichzeitige Audits + ML-Kompression (--llmlingua) sättigen das Apple Silicon.
Lösung: Entfernen Sie --llmlingua, sofern Sie keine maximale Verkleinerung brauchen; richten Sie sich nach den Grenzen für Tool-Parallelität / ulimit. Begrenzen Sie OpenClaws gleichzeitige Tool-Aufrufe in cron-Fenstern auf 3–5.
FAQ
Ersetzt Headroom OpenClaws Token-Throttles?
Nein. Headroom verkleinert, was hineingeht ins Modell; OpenClaw drosselt, wie oft Tools feuern. Nutzen Sie beides — siehe Tokenbudget-Runbook.
Ist die Einsparung von 80 % garantiert?
Headroom veröffentlicht je nach Workload Bereiche von 60–95 %. Tool-lastige OpenClaw-Audits landen oft bei 60–92 %; kurze Gesprächs-Turns sparen weniger. Messen Sie /stats in Ihrem Repo.
Wird Anthropic Proxy-Anfragen blockieren?
Headroom leitet mit Ihrem Schlüssel an die offizielle API weiter — wie die direkte SDK-Nutzung. Halten Sie ANTHROPIC_API_KEY nur auf dem Proxy-Host; rotieren Sie ihn bei Log-Leaks.
Kann ich Headroom unter Linux betreiben, während OpenClaw auf macOS bleibt?
Ja — setzen Sie ANTHROPIC_BASE_URL=http://linux-host:8787, wenn die Firewall es zulässt. Latenzsensible Gateways bevorzugen einen co-lokalisierten Proxy auf demselben Mac mini.
Wie verhält sich das zur Trajektorienkompression von Hermes?
Hermes komprimiert Agenten-Speicher-Transkripte; Headroom komprimiert Tool-Ausgaben und Nachrichten auf HTTP-Ebene. Zur Harness-Wahl lesen Sie Hermes vs. OpenClaw — Stacks können auf verschiedenen Hosts koexistieren.
Lokales Ollama statt Anthropic? Derselbe Headroom-Proxy verkleinert Tool-Payloads für On-Device-Modelle — siehe Headroom + Ollama lokale Latenz für Prefill-Fixes auf 16-GB-Mac mini.
OpenClaw + Headroom auf Cloud-Mac-mini testen
Proxy und Gateway auf Apple Silicon per SSH/VNC — Ports und LaunchAgent-Reihenfolge vor Prod-Keys prüfen.