當 OpenClaw 不再回應 webhook,或閘道開始拋出 401,最快的恢復路徑不是隨機重新開機——而是用 openclaw doctor、結構化日誌與通道探測做一輪有紀律的診斷。本手冊梳理 2026 年常用命令集,把常見故障對應到修復動作,並說明團隊為何把整個閉環放在租用的 Apple Silicon Mac mini 上,而不是一台闔上蓋子就休眠的筆電。
應先跑 doctor 的訊號
若你看到這些重複模式,請跳過論壇貼文:閘道顯示健康但智慧體從不接活;日誌裡 Unauthorized 帶代碼 1008;或你改過隧道後 Slack 事件重複投遞。這些都適合先用 openclaw doctor 暴露版本錯位、缺失環境變數或陳舊權杖,再花一小時去 tail 無關堆疊。
若剛升級 Node,請把 doctor 與 openclaw status --deep 一起跑——OpenClaw 2026 文件假設 Node 22.16+ 或 Node 24 涵蓋若干 CLI 路徑。更老的執行階段可能通過基礎安裝,卻在外掛匯入僅 ESM 的輔助函式庫時失敗。
事故一開始就匯出快照:複製 doctor 輸出(脫敏),並附上 openclaw logs 的前 200 行。養成此習慣的團隊關單速度常快40%–60%,因為廠商與內審看到同一事實,而不是事後拼的截圖。
若最近切換 VPN 分流,請在與閘道相同的網路路徑上重跑 doctor。非對稱路由是典型原因:探測在你筆電上成功,在守護程序帳戶下卻失敗。
把診斷輸出納入版本控制外的安全工單系統時,統一使用團隊模板欄位(時間戳、設定檔雜湊、通道清單),可減少值班交接時的口頭遺漏。對於多區域部署,還要註明 doctor 所在時區與 NTP 同步狀態,避免把時鐘漂移誤判為權杖過期。
症狀矩陣:命令與含義
把下表當分診板。命令在同等 staging 環境執行通常安全;若變更需重啟閘道,請在維護視窗內推進。
| 症狀 | 首選命令 | 「正常」長什麼樣 |
|---|---|---|
| 閘道已起但 UI 連不上 | openclaw gateway status | 單一監聽 PID,綁定位址符合預期(常在代理後是 127.0.0.1) |
| 隨機斷連 | openclaw logs --follow | 一輪對話後 5 分鐘內無重複 TLS 或權杖錯誤 |
| Slack/Discord 靜默 | openclaw channels status --probe | 各啟用通道報告端點可達且 OAuth 範圍有效 |
| 部署後埠號衝突 | lsof -nP -iTCP:PORT | grep LISTEN | 僅一個 OpenClaw 相關行程佔用該埠號 |
| 來自提供商的 LLM 401 | 檢查 API 金鑰環境與帳單 | 按量付費的開發者金鑰——而非消費者訂閱——驅動自動化 |
矩陣之外,建議為每次重大升級保留「升級前後 doctor 全文 diff」,便於回復決策與稽核追蹤。
閘道權杖與 allowedOrigins
許多團隊在設定從扁平欄位 gateway.token 遷到 gateway.auth.token 後,控制台整合斷裂。若反向代理仍注入舊標頭,請透過 openclaw doctor --generate-gateway-token 重新產生憑證,並同時更新代理與本地 ~/.openclaw/openclaw.json 副本。
瀏覽器用戶端還需要顯式 allowedOrigins:開發期列出 http://localhost:3000,上線後寫入生產主機名。萬用字元 * 省事但不安全;當 OpenClaw 暴露在公網可達網段時,稽核會立刻標紅。隧道情境請與 閘道代理與隧道加固 一文中的來源站對齊方式保持一致。
出現 EADDRINUSE 通常表示兩個設定檔或殭屍 node 搶同一埠號。結束陳舊 PID,用第二次 lsof 確認,再按文件化的服務管理器重啟。在 macOS 伺服器上,遵循 LaunchAgent 與排程模式,使重啟可預期。
權杖輪換後,務必在 staging 上完整走一遍「登出再登入」與 webhook 重播,以免生產僅在部分用戶端上更新。若使用 mTLS 或自訂 JWT,doctor 可能顯示 green,但仍需在邊緣層驗證憑證鏈是否完整。
超越 HTTP 200 的通道探測
webhook 可能回傳 200 OK 卻仍丟事件——例如簽章校驗靜默失敗。輪換金鑰後執行 openclaw channels status --probe,並從每個聊天介面傳送合成訊息。在日誌中抓取關聯 ID;多數團隊在 staging 主機保留14 天日誌留存以便與生產事故對照。
手工偵錯 HTTP 回呼時,用 curl 帶上整合實際傳送的相同標頭。缺少 Authorization: Bearer … 前綴或貼上權杖時多出的換行會導致 401,看起來像提供商當機。比較 body 體積:部分代理在 1 MB 以上截斷負載,直到你提高限制或改用分塊上傳前,大型 JSON 工具呼叫都會失敗。
對 WhatsApp 或行動優先橋接,按廠商文件登出衝突的桌面工作階段;重複工作階段常表現為「到哪都送達,除了 OpenClaw」。Discord 與 Slack 問題常可追溯至工作區管理員收緊策略後缺失的讀取訊息歷程或傳送訊息權限。
安排每週五分鐘的探測任務——例如 cron 呼叫 openclaw health --json 並在非零離開時寄信——讓迴歸在週一會前暴露,而不是客戶演示當中。
若通道經過企業代理,請同時記錄 CONNECT 隧道與 SNI 行為;某些代理對 WebSocket 升級不友善,需要在 doctor 輸出之外用 tcpdump 或 mitm 友善工具做一次性擷包驗證。
為何在雲端 Mac 上跑診斷
筆電會睡眠,VPN 會抖動,MDM 會阻止守護程序——這些都不利於你需要 72 小時浸泡測試的情境。租用的 Apple Silicon Mac mini 持續線上,提供與本地 macOS 相同的 Unix 工具,並把金鑰與個人 BYOD 隔離。SSH 讓迭代飛快:跑 doctor、用 vim 改設定、重啟服務、跟日誌,無需走到工位。
成本上,把每天約 16.9 美元的彈性租用與工程師被卡住一下午的機會成本對比。診斷很少需要 GPU;需要的是穩定電力、準確時鐘,以及不會在排查中途因系統補丁重新開機的機器。事件結束後停止租用——這是資本設備閒置在儲藏室做不到的。
維運提示:在雲主機與 CI 映像之間鏡像目錄佈局,使 openclaw.json 中的路徑可攜。硬編碼 /Users/alice/Projects 的團隊在任務遷到共享自動化帳戶時往往要多花數小時改設定。
記憶體規劃仍重要:在較小 Mac mini 檔位上,若同時啟用多路通道橋接,請至少保留4 GB閒置記憶體。doctor 在核心已開始因交換抖動拖慢探測前未必告警——請在壓力測試時觀察活動監視器中的 memory_pressure 或終端機裡的 vm_stat。
對跨地域團隊,把雲端診斷主機的 SSH 指紋與 sudo 策略寫進內部知識庫,可減少新成員誤連錯誤環境或覆寫生產設定的風險。
常見問題
新版 OpenClaw 裡 gateway.token 去哪了?
近期版本將鑑權巢狀在 gateway.auth.token 下。若控制台仍讀舊扁平鍵,請用 openclaw doctor --generate-gateway-token 重新產生,並在反向代理或 UI 期望處全部更新。
重新開機後立刻出現 EADDRINUSE 是為什麼?
LaunchAgent、手動終端機與遺留 node 行程都可能綁定同一閘道埠號。用 lsof -i :PORT 找 PID,停止重複設定檔,並確保每個設定檔僅執行一個 openclaw gateway 實例。
雲端 Mac mini 對 OpenClaw 診斷有用嗎?
有用。Apple Silicon Mac mini 提供與本地 macOS 相同的 Unix 工具鏈、穩定電力供長時間跟日誌,並與易休眠的筆電隔離。按天租用讓你在加固閘道時保持成本彈性。
OpenClaw 在底層主機「無聊」時最穩:電力可靠、SSD 快、macOS 行為與生產一致。Apple Silicon 為並行 doctor、日誌聚合與輕量瀏覽器 webhook 測試留出餘量,又沒有巨型塔式風扇噪音。把 SSH 自動化與可選 VNC 視覺檢查結合,你就得到一張可按事故擴容、安靜週縮容的診斷台——正是 AI 智慧體進入部署 fabric 時 Mac 風格 HTML 團隊需要的彈性。
在始終線上的 Apple Silicon 上 staging OpenClaw
租用雲端 Mac mini,在不受筆電睡眠或 MDM 驚擾的情況下執行 doctor、閘道與通道探測。先看定價,再依說明文件用 SSH 接入。