Если в 2026 на macOS-шлюзе OpenClaw крутится одна премиум-модель, продакшен встаёт при HTTP 429 от Anthropic, 503 от OpenAI или региональном сбое единственного API-ключа. Отказ модели и явная маршрутизация провайдеров превращают жёсткие стопы в ограниченную деградацию: документированная резервная цепочка, совместимые схемы инструментов, бюджеты retry с уважением Retry-After. Туториал показывает цепочку в ~/.openclaw/openclaw.json, секреты вне git и проверку через openclaw doctor до продакшен plist LaunchAgent. Сочетайте с дисциплиной 429, профилями JSON и окружения, upstream circuit breaker и диагностикой doctor.
Вы получите матрицу решений, копируемый скелет конфигурации, числовые ограничители (макс. 3 провайдера на горячем пути, 30 с на попытку, 120 с на ход) и чеклист staging на арендованном Apple Silicon Mac mini примерно за 16,9 $/сутки по прайсу MacHTML.
Симптомы необходимости отказа
Каналы зависают на «думает…», а в логах снова ошибки провайдера. Вызовы инструментов стопорятся mid-turn, потому что шлюз исчерпал retry одного вендора. Финансы видят сюрприз-счета, когда в 2 ночи вручную меняют ключи вместо проверенного резервного маршрута—сигнал в маршрутизации, не в качестве модели.
Отказ — не «всегда самая дешёвая модель». Это контролируемая деградация: премиум для клиента, mid для внутренних HTML/CSS-аудитов, локальный Ollama только для нерушащих сводок при падении облака—каждый уровень документирован и проверен зондом.
Принципы проектирования цепочки
Горячий путь короткий: не более трёх провайдеров, еженедельная проба с той же схемой инструментов, что у HTML/CSS-агентов. Если продакшен требует правки файлов, не fail-open на модели без write—только read-only-сводки. Логируйте провайдера и correlation id за ход для атрибуции всплесков затрат.
Разделяйте цепочки staging и production даже на одном железе; опечатка в staging JSON не должна уронить продакшен на экспериментальную локальную модель.
Скелет маршрутизации openclaw.json
Маршрутизация рядом с—не внутри—HTML под git. Имена провайдеров в openclaw.json, ключи API в ~/.openclaw/.env с chmod 600. Документируйте ID основной модели, упорядоченные fallback, таймауты и опциональные потолки стоимости.
{
"agents": {
"default": {
"model": {
"primary": "anthropic/claude-sonnet-4-20250514",
"fallbacks": [
"openai/gpt-4.1",
"google/gemini-2.5-pro"
]
},
"providers": {
"anthropic": { "timeoutMs": 30000 },
"openai": { "timeoutMs": 30000 },
"google": { "timeoutMs": 45000 }
}
}
}
}
Фрагмент — структурная подсказка; имена полей меняются между релизами OpenClaw, сделайте diff перед вставкой. Затем openclaw doctor и однострочная чат-проба на провайдера.
Матрица выбора провайдеров
| Уровень | Когда | Риск |
|---|---|---|
| Основной (премиум) | Клиентские ходы Slack/Telegram | Исчерпание квоты при релизах |
| Резервный (mid) | Внутренние аудиты, несрочные фиксы | Дрейф схемы инструментов |
| Локальный (Ollama) | Read-only-сводки при падении облака | Меньшая глубина облака |
| Отключено | Деструктивные инструменты в аварии | Давление «просто включить» |
429, 503 и Retry-After
Отказ не заменяет лимиты. При 429 от основного соблюдайте Retry-After до документированного потолка (в чате часто 30 секунд), затем резервный провайдер. При шторме 503 связывайте маршрутизацию с circuit breaker шлюза. Таблицы backoff: статья 429.
Ограничьте ход около 120 секунд; читаемое сообщение о деградации вместо пяти провайдеров подряд.
Совместимость схем инструментов
Все модели цепочки должны принимать одни JSON-определения инструментов шлюза. Резерв без browser ломает HTML/CSS-конвейеры. Перед продакшен-fallback на staging три фиксированных вызова: чтение файла, запись патча, список каталога.
Если у резерва нет vision, а основной с картинками — уберите image-части или маршрутизируйте изображения только на vision-резерв.
Пробы doctor и синтетические чаты
После правок маршрутизации приложите openclaw doctor --json к тикету. Синтетические сообщения для каждого fallback: отозвать основной ключ на staging, резерв отвечает за 10 секунд, восстановить ключ, основной без рестарта. Смотрите метки провайдера в логах шлюза.
Согласуйте пробы с профилями staging/production—не тестируйте fallback с продакшен-секретами на ноутбуке разработчика.
Чеклист rollout staging
- Экспорт отпечатков
openclaw.jsonи.env(без секретов) в git-ignored хранилище. - Резервные ключи с отдельными billing-алертами.
- Дымовые тесты инструментов на порту staging-шлюза по каждому провайдеру.
- Симуляция падения основного ключа; fallback в SLA.
- plist LaunchAgent после 24 часов чистых метрик staging.
- Документировать откат: JSON +
launchctl kickstart.
FAQ
Те же определения инструментов для отказа?
Да—тестируйте вызовы инструментов у каждого провайдера до цепочки.
Отказ автоматически чинит 429?
Только при отдельной квоте резерва; иначе нужен backoff.
Как часто doctor?
После каждого изменения маршрутизации или секрета; в продакшене — еженедельный cron.
Аренда Apple Silicon Mac mini через MacHTML держит тесты маршрутизации на тех же сборках WebKit/Node, что у руководства—not Linux-контейнер вместо macOS. SSH для чат-проб, VNC при Keychain. Простой часто 6–12 Вт; неделя репетиции отказа дешевле ночи «provider error» во всех каналах.
Публичная цена около 16,9 $/сутки. После репетиции остановите инстанс; таблицы маршрутизации остаются в git без CapEx на 36 месяцев.
Репетиция отказа модели OpenClaw на реальном macOS
Арендуйте облачный Mac mini, чтобы проверить цепочки провайдеров, fallback 429 и пробы doctor до продакшен LaunchAgents.