Ночные аудиты репозитория OpenClaw запускают линтеры, тест-раннеры и потоки grep, возвращающие мегабайты JSON в контекст модели. Платить Anthropic по прайсу за каждый сырой байт — так дисциплинированная автоматизация превращается в четырёхзначную строку счёта за API. Headroom стоит между шлюзом и провайдером: локальный прокси на порту 8787 (по умолчанию), который сжимает вывод инструментов, логи и историю с помощью SmartCrusher / CodeCompressor / CCR до того, как запросы достигнут api.anthropic.com. Опубликованные бенчмарки показывают 92% сокращения токенов на трейсах в стиле SRE и 73–92% на задачах поиска по коду — это руководство нацелено на 60–80%+ экономии на насыщенных инструментами ходах без изменения Markdown ваших Skill.
Сочетайте это с защитами расходов из нашего руководства бюджеты токенов и лимиты инструментов OpenClaw и планированием шлюза в LaunchAgents против cron на macOS. Гигиена секретов — в профилях openclaw.json и .env.
Раскрытие: MacHTML опционально предлагает аренду облачного Mac mini для стейджинг-шлюзов; этот ранбук нейтрален к вендорам и работает на любом хосте macOS.
Почему OpenClaw + Headroom — уникальный стек
OpenClaw силён в постоянно работающих шлюзах: приём из Slack/Telegram, списки разрешённых инструментов и многошаговые Skill, которые перечитывают огромные деревья рабочих областей. Headroom силён в сжатии контекста — не резюмируя ваше намерение, а уменьшая то, что возвращают инструменты. Сочетание редкое, потому что большинство команд выбирают лишь один рычаг:
| Рычаг | Что сокращает | Слепая зона |
|---|---|---|
| Только лимиты OpenClaw | Число ходов, параллелизм | Всё ещё шлёт 50 КБ JSON линтера дословно |
| Только меньшая модель | $/токен на вход/выход | Пропускает находки в сложных аудитах |
| Ручная обрезка логов в Skill | Ситуативно | Ломает воспроизводимость между запусками cron |
| Прокси Headroom + OpenClaw | Токены инструментов/RAG/логов до провайдера | Требует локального процесса Python 3.10+ |
README Headroom называет OpenClaw интеграцией первого класса (путь плагина ContextEngine плюс универсальный OpenAI-совместимый прокси). Вы сохраняете оркестрацию OpenClaw; Headroom переписывает форму полезной нагрузки, которую видит модель.
Внешние ссылки: Headroom GitHub, документация прокси Headroom, Anthropic API.
Архитектура: шлюз → прокси → Anthropic
┌─────────────┐ HTTP/SSE ┌──────────────────────┐ HTTPS ┌─────────────────┐
│ OpenClaw │ ────────────► │ Headroom proxy │ ────────► │ api.anthropic.com│
│ gateway │ 127.0.0.1:8787│ SmartCrusher + CCR │ │ (real API key) │
│ :8788 tools │ │ /v1/messages │ └─────────────────┘
└─────────────┘ └──────────────────────┘
▲ │
│ tool stdout/json │ headroom_retrieve if model needs originals
└──────────────────────────────┘
Правило маршрутизации: OpenClaw читает базовые URL провайдеров из окружения (~/.openclaw/.env) и openclaw.json. Направьте трафик Anthropic на Headroom, а не на публичную конечную точку. Headroom пересылает с вашим реальным ANTHROPIC_API_KEY из окружения процесса прокси — OpenClaw может сохранить ту же переменную ключа, но хост должен быть локальным.
Дисциплина портов: прокси Headroom по умолчанию занимает 8787 — тот же порт, что и многие примеры шлюза OpenClaw. В продакшене запускайте Headroom на 8787 и перенесите шлюз OpenClaw на 8788 (или наоборот). Зафиксируйте пару в ваших plist LaunchAgent.
Пошаговый ранбук (macOS 2026)
1. Установить Headroom с прокси-экстрами
python3 --version # must be 3.10+
pip install "headroom-ai[proxy]"
headroom --version
На Apple Silicon допустимо pip install "headroom-ai[all]", если позволяет диск; вариант только-прокси делает образы меньше.
2. Запустить прокси с логированием и статистикой
export ANTHROPIC_API_KEY="sk-ant-..." # real key — proxy forwards upstream
headroom proxy \
--host 127.0.0.1 \
--port 8787 \
--log-file ~/.headroom/openclaw-proxy.jsonl
Проверьте состояние:
curl -s http://127.0.0.1:8787/health | python3 -m json.tool
curl -s http://127.0.0.1:8787/stats | python3 -m json.tool
После тестового трафика вы хотите видеть optimize: true и растущий tokens_saved.
3. Маршрутизировать вызовы Anthropic из OpenClaw через прокси
Отредактируйте ~/.openclaw/.env (chmod 600):
ANTHROPIC_API_KEY=sk-ant-...
ANTHROPIC_BASE_URL=http://127.0.0.1:8787
# If you use OpenAI-compatible models in the same gateway:
# OPENAI_BASE_URL=http://127.0.0.1:8787/v1
Убедитесь, что OpenClaw разрешает env до старта шлюза — см. профили JSON и .env. Не коммитьте эти строки.
4. При необходимости увести шлюз OpenClaw с порта 8787
В ~/.openclaw/openclaw.json задайте порт прослушивания шлюза 8788, когда Headroom занимает 8787:
{
"gateway": {
"port": 8788,
"host": "127.0.0.1"
}
}
Перезапустите шлюз; health-пробы должны нацеливаться на 8788, а не на порт Headroom.
5. Опционально — нативный путь плагина Headroom для OpenClaw
Headroom документирует OpenClaw как плагин ContextEngine (headroom/providers/openclaw). Если предпочитаете режим плагина сырому базовому URL:
pip install "headroom-ai[all]"
headroom wrap openclaw # when available in your installed version
Если wrap openclaw отсутствует, оставайтесь на proxy + ANTHROPIC_BASE_URL — это поддерживаемый универсальный путь согласно документации прокси.
6. Дымовой тест сжатия на крупной нагрузке инструмента
Запустите Skill, возвращающий большой JSON (вывод теста или результаты find). Сравните:
curl -s http://127.0.0.1:8787/stats | python3 -m json.tool
tail -n 5 ~/.headroom/openclaw-proxy.jsonl
Цель: savings_percent стремится к ≥40% на первом реальном аудите; насыщенные инструментами ночи часто превышают 60–80%.
7. Закрепить Headroom под launchd (параллельно OpenClaw)
Создайте ~/Library/LaunchAgents/ai.headroom.proxy.plist с ProgramArguments, вызывающими headroom proxy --host 127.0.0.1 --port 8787, с EnvironmentVariables для ANTHROPIC_API_KEY и StandardOutPath в ~/.headroom/logs/. Загружайте его до ai.openclaw.gateway, чтобы базовый URL разрешался при старте шлюза — шаблоны в руководстве по LaunchAgent и cron.
8. Подключить сайдкары MCP / Claude Code (опционально)
Headroom предоставляет инструменты MCP (headroom_compress, headroom_retrieve, headroom_stats). Для песочниц Claude Code, питающих Skill OpenClaw, установите MCP один раз:
headroom mcp install
Skill OpenClaw могут обращаться к той же конечной точке статистики сжатия http://127.0.0.1:8787/stats для дашбордов.
9. Задать бюджетные ограничители на прокси
headroom proxy --port 8787 --budget 50.0 --log-file ~/.headroom/openclaw-proxy.jsonl
--budget 50.0 задаёт суточный потолок в USD внутри Headroom — дополнение, а не замена пошаговым лимитам OpenClaw.
10. Проверить через openclaw doctor
openclaw doctor
doctor должен показать шлюз здоровым на 8788, провайдера доступным через 127.0.0.1:8787 и отсутствие дублирующего бинда порта (EADDRINUSE).
Шаблон ночного конвейера аудита
Обычно cron или LaunchAgent в 02:00 по местному запускает Skill OpenClaw:
git fetch --allи diff относительноmain- Запуск
npm test/eslint/ своего скрипта аудита через разрешённые инструменты - Публикация сводки в Slack
Без Headroom шаг 2 часто впрыскивает 15–65 тыс. токенов stderr (опубликованный бенчмарк SRE: 65 694 → 5 118 токенов). При сжатии на прокси та же строка FATAL остаётся доступной через извлечение CCR, если модель запросит оригиналы.
Цитата: Маршрутизация трафика Anthropic из OpenClaw через Headroom на 127.0.0.1:8787 может сократить насыщенный инструментами контекст на 60–92%, сохраняя обратимость через CCR — складывайте с лимитами OpenClaw для контроля расходов, а не вместо них.
Сравните выбор харнесса в Hermes против OpenClaw, когда разделяете сжатие памяти и сжатие инструментов на уровне HTTP.
Устранение неполадок
Шлюз возвращает 502 / отказ соединения в чате
Симптом: логи OpenClaw показывают ошибки апстрима сразу после включения прокси.
Исправление: убедитесь, что Headroom слушает (curl http://127.0.0.1:8787/health). Если шлюз и прокси оба заняли 8787, разделите порты (шаг 4). Перезагрузите LaunchAgents по порядку: сначала Headroom, затем OpenClaw.
Экономия остаётся около 0% в /stats
Симптом: tokens_saved не растёт; transforms пуст.
Исправление: убедитесь, что трафик действительно идёт через прокси — ANTHROPIC_BASE_URL должен быть задан в окружении процесса шлюза, а не только в интерактивной оболочке. Для отладки сквозного режима временно запустите headroom proxy --no-optimize и сравните. Крупные нагрузки должны быть телами инструментов/сообщений, а не крошечными подсказками.
Модель «теряет» детали трассировки стека
Симптом: сжатый ход опускает номера строк, которые ожидают аудиторы.
Исправление: Headroom CCR хранит оригиналы локально; добавьте в текст Skill разрешение на headroom_retrieve или задайте x-headroom-bypass: true на один диагностический ход. Не отключайте сжатие глобально для ночных запусков — вместо этого исправьте политику извлечения.
EMFILE или скачок CPU на Mac mini
Симптом: одновременные аудиты + ML-сжатие (--llmlingua) насыщают Apple Silicon.
Исправление: уберите --llmlingua, если не нужна максимальная усадка; согласуйте с лимитами параллелизма инструментов / ulimit. Ограничьте одновременные вызовы инструментов OpenClaw до 3–5 в окнах cron.
FAQ
Заменяет ли Headroom лимиты токенов OpenClaw?
Нет. Headroom уменьшает то, что входит в модель; OpenClaw ограничивает, как часто срабатывают инструменты. Используйте оба — см. ранбук бюджета токенов.
Гарантирована ли экономия 80%?
Headroom публикует диапазоны 60–95% по типу нагрузки. Насыщенные инструментами аудиты OpenClaw часто дают 60–92%; короткие разговорные ходы экономят меньше. Измеряйте /stats на своём репозитории.
Будет ли Anthropic блокировать запросы через прокси?
Headroom пересылает в официальный API с вашим ключом — как при прямом использовании SDK. Держите ANTHROPIC_API_KEY только на хосте прокси; меняйте при утечке логов.
Можно ли запускать Headroom на Linux, пока OpenClaw остаётся на macOS?
Да — задайте ANTHROPIC_BASE_URL=http://linux-host:8787, если позволяет файрвол. Чувствительные к задержке шлюзы предпочитают совмещённый прокси на том же Mac mini.
Чем это отличается от сжатия траекторий Hermes?
Hermes сжимает транскрипты памяти агента; Headroom сжимает вывод инструментов и сообщения на уровне HTTP. По выбору харнесса читайте Hermes против OpenClaw — стеки могут сосуществовать на разных хостах.
Используете локальный Ollama вместо Anthropic? Тот же прокси Headroom сжимает полезную нагрузку инструментов — см. Headroom + Ollama локальная задержка для устранения зависаний prefill на Mac mini 16 ГБ.
Проверка OpenClaw + Headroom на облачном Mac mini
Прокси и шлюз на Apple Silicon по SSH/VNC — порты и порядок LaunchAgent до прод-ключей.