AI Frontier

OpenClaw 2026 на macOS: отказ модели и маршрутизация провайдеров—основные/резервные LLM-цепочки, обработка 429, openclaw.json, репетиция на облачном Mac mini

MacHTML Lab2026.05.2129 мин чтения

Если в 2026 на macOS-шлюзе OpenClaw крутится одна премиум-модель, продакшен встаёт при HTTP 429 от Anthropic, 503 от OpenAI или региональном сбое единственного API-ключа. Отказ модели и явная маршрутизация провайдеров превращают жёсткие стопы в ограниченную деградацию: документированная резервная цепочка, совместимые схемы инструментов, бюджеты retry с уважением Retry-After. Туториал показывает цепочку в ~/.openclaw/openclaw.json, секреты вне git и проверку через openclaw doctor до продакшен plist LaunchAgent. Сочетайте с дисциплиной 429, профилями JSON и окружения, upstream circuit breaker и диагностикой doctor.

Вы получите матрицу решений, копируемый скелет конфигурации, числовые ограничители (макс. 3 провайдера на горячем пути, 30 с на попытку, 120 с на ход) и чеклист staging на арендованном Apple Silicon Mac mini примерно за 16,9 $/сутки по прайсу MacHTML.

Симптомы необходимости отказа

Каналы зависают на «думает…», а в логах снова ошибки провайдера. Вызовы инструментов стопорятся mid-turn, потому что шлюз исчерпал retry одного вендора. Финансы видят сюрприз-счета, когда в 2 ночи вручную меняют ключи вместо проверенного резервного маршрута—сигнал в маршрутизации, не в качестве модели.

Отказ — не «всегда самая дешёвая модель». Это контролируемая деградация: премиум для клиента, mid для внутренних HTML/CSS-аудитов, локальный Ollama только для нерушащих сводок при падении облака—каждый уровень документирован и проверен зондом.

Принципы проектирования цепочки

Горячий путь короткий: не более трёх провайдеров, еженедельная проба с той же схемой инструментов, что у HTML/CSS-агентов. Если продакшен требует правки файлов, не fail-open на модели без write—только read-only-сводки. Логируйте провайдера и correlation id за ход для атрибуции всплесков затрат.

Разделяйте цепочки staging и production даже на одном железе; опечатка в staging JSON не должна уронить продакшен на экспериментальную локальную модель.

Скелет маршрутизации openclaw.json

Маршрутизация рядом с—не внутри—HTML под git. Имена провайдеров в openclaw.json, ключи API в ~/.openclaw/.env с chmod 600. Документируйте ID основной модели, упорядоченные fallback, таймауты и опциональные потолки стоимости.

{
  "agents": {
    "default": {
      "model": {
        "primary": "anthropic/claude-sonnet-4-20250514",
        "fallbacks": [
          "openai/gpt-4.1",
          "google/gemini-2.5-pro"
        ]
      },
      "providers": {
        "anthropic": { "timeoutMs": 30000 },
        "openai": { "timeoutMs": 30000 },
        "google": { "timeoutMs": 45000 }
      }
    }
  }
}

Фрагмент — структурная подсказка; имена полей меняются между релизами OpenClaw, сделайте diff перед вставкой. Затем openclaw doctor и однострочная чат-проба на провайдера.

Матрица выбора провайдеров

УровеньКогдаРиск
Основной (премиум)Клиентские ходы Slack/TelegramИсчерпание квоты при релизах
Резервный (mid)Внутренние аудиты, несрочные фиксыДрейф схемы инструментов
Локальный (Ollama)Read-only-сводки при падении облакаМеньшая глубина облака
ОтключеноДеструктивные инструменты в аварииДавление «просто включить»

429, 503 и Retry-After

Отказ не заменяет лимиты. При 429 от основного соблюдайте Retry-After до документированного потолка (в чате часто 30 секунд), затем резервный провайдер. При шторме 503 связывайте маршрутизацию с circuit breaker шлюза. Таблицы backoff: статья 429.

Ограничьте ход около 120 секунд; читаемое сообщение о деградации вместо пяти провайдеров подряд.

Совместимость схем инструментов

Все модели цепочки должны принимать одни JSON-определения инструментов шлюза. Резерв без browser ломает HTML/CSS-конвейеры. Перед продакшен-fallback на staging три фиксированных вызова: чтение файла, запись патча, список каталога.

Если у резерва нет vision, а основной с картинками — уберите image-части или маршрутизируйте изображения только на vision-резерв.

Пробы doctor и синтетические чаты

После правок маршрутизации приложите openclaw doctor --json к тикету. Синтетические сообщения для каждого fallback: отозвать основной ключ на staging, резерв отвечает за 10 секунд, восстановить ключ, основной без рестарта. Смотрите метки провайдера в логах шлюза.

Согласуйте пробы с профилями staging/production—не тестируйте fallback с продакшен-секретами на ноутбуке разработчика.

Чеклист rollout staging

  1. Экспорт отпечатков openclaw.json и .env (без секретов) в git-ignored хранилище.
  2. Резервные ключи с отдельными billing-алертами.
  3. Дымовые тесты инструментов на порту staging-шлюза по каждому провайдеру.
  4. Симуляция падения основного ключа; fallback в SLA.
  5. plist LaunchAgent после 24 часов чистых метрик staging.
  6. Документировать откат: JSON + launchctl kickstart.

FAQ

Те же определения инструментов для отказа?

Да—тестируйте вызовы инструментов у каждого провайдера до цепочки.

Отказ автоматически чинит 429?

Только при отдельной квоте резерва; иначе нужен backoff.

Как часто doctor?

После каждого изменения маршрутизации или секрета; в продакшене — еженедельный cron.

Аренда Apple Silicon Mac mini через MacHTML держит тесты маршрутизации на тех же сборках WebKit/Node, что у руководства—not Linux-контейнер вместо macOS. SSH для чат-проб, VNC при Keychain. Простой часто 6–12 Вт; неделя репетиции отказа дешевле ночи «provider error» во всех каналах.

Публичная цена около 16,9 $/сутки. После репетиции остановите инстанс; таблицы маршрутизации остаются в git без CapEx на 36 месяцев.

Репетиция отказа модели OpenClaw на реальном macOS

Арендуйте облачный Mac mini, чтобы проверить цепочки провайдеров, fallback 429 и пробы doctor до продакшен LaunchAgents.

Репетиция отказа на Mac
От ~16,9 $/сутки