M4 16GB 够跑 TradingAgents 吗？

可用 8B 深度模型 + 3B 快速模型，并将 max_debate_rounds 设为 1；24GB 更适合完整研究流程。

TradingAgents 连哪个 Ollama 端点？

默认 OpenAI 兼容基址 http://localhost:11434/v1，远程主机用 OLLAMA_BASE_URL 覆盖。

TradingAgents + Ollama Mac mini M4 零 API 成本 2026

TradingAgents（TauricResearch）是基于 LangGraph 的多智能体交易研究框架：分析师团队、多空辩论、交易员、风控与组合管理。在 Mac mini M4 上用 Ollama 本地推理（http://localhost:11434/v1），可把边际 LLM 费用压到 ¥0 / $0（按 token 的云端 API 不再计费）。本文覆盖安装、llm_provider: "ollama"、16GB/24GB 双模型分流、docker compose --profile ollama，以及租用云 Mac（约 ¥120/天、$16.9/天）做 24/7 批跑。

若你还要把行情钩子接到自动化栈，可先读 OpenClaw Webhook 与 Ollama；硬件与远程办公场景见 Mac mini M4 远程办公。权威参考：Ollama 文档、Apple Mac mini 规格。

披露：本文提到的云 Mac mini 租用服务由 MacHTML 提供。

为何在 M4 上用 Ollama 跑 TradingAgents

单只股票分析常触发 4–8 次 LLM 调用（多轮辩论）。云端 API 按 token 叠加很快；Ollama 在 Apple Silicon 上以 OpenAI 兼容接口暴露 11434 端口。TradingAgents v0.2.5+ 支持 llm_provider: "ollama"，远程实例可用 OLLAMA_BASE_URL 指向另一台 Mac mini。

M4 Mac mini 空闲功耗常见 6–12 W，比笔记本通宵跑图、风扇拉满更省电，适合把研究批处理迁到专用节点。

大陆开发者常见痛点（npm 与出口带宽）

在本地笔记本拉 TradingAgents 与 Python 依赖时，npm / PyPI 镜像不稳定会拖垮首日搭建；把环境放到海外或香港节点的云 Mac，用 SSH 在机房内网完成 pip install .，往往比反复折腾国内代理更省时。模型权重经 ollama pull 下载时，出口带宽与晚高峰抖动同样致命——建议在云 Mac 上一次性拉齐 llama3.1:8b 与 llama3.2:3b，本地机器只跑客户端与 OLLAMA_BASE_URL 隧道。

团队合规场景下，行情与研报数据尽量留在租用实例磁盘，避免把未脱敏日志同步到个人网盘；MacHTML 节点可按项目隔离用户目录与 LaunchAgent。

硬件与 16GB / 24GB 双模型分流

统一内存	deep_think_llm	quick_think_llm	建议
16 GB	`llama3.1:8b`	`llama3.2:3b`	`max_debate_rounds=1`
24 GB	`qwen2.5:14b`	`llama3.2:3b`	默认研究档
32 GB+	`qwen2.5:32b`（Q4）	`llama3.1:8b`	更长分析师链

Apple 官方 Mac mini 规格页列出最高 32 GB 统一内存。切勿在 16GB 上把两个大模型同时塞进内存，否则 OOM（退出码 137）很常见。

安装 TradingAgents 与 Ollama

brew install ollama
ollama pull llama3.1:8b
ollama pull llama3.2:3b

git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents
python3.13 -m venv .venv && source .venv/bin/activate
pip install .

验证守护进程：curl -sS http://127.0.0.1:11434/api/tags。OpenAI 兼容面为 /v1，与 TradingAgents 默认一致。

配置 llm_provider ollama

config = DEFAULT_CONFIG.copy()
config["llm_provider"] = "ollama"
config["deep_think_llm"] = "llama3.1:8b"
config["quick_think_llm"] = "llama3.2:3b"
config["max_debate_rounds"] = 1

ta = TradingAgentsGraph(debug=True, config=config)
_, decision = ta.propagate("AAPL", "2026-05-20")

交互式：tradingagents 选择 Ollama 与模型 ID。M4 16GB + 8B/3B 组合下单票常见 5–20 分钟，换来 $0 token 账单。

Docker：`docker compose --profile ollama`

docker compose --profile ollama up -d --build
docker compose --profile ollama run --rm tradingagents-ollama

日常研究循环在 Apple Silicon 上通常 原生 Ollama + venv 比 Docker 更快；Docker 适合团队统一镜像与 CI 冒烟。

云 Mac mini 演练（MacHTML 租用）

笔记本长时间跑 LangGraph 易温控降频。租用 Apple Silicon Mac mini 可让 Ollama 24/7 在线，SSH 批量跑 ticker；公开价约 ¥120/天、$16.9/天，两周实验往往低于闲置自购机器。结合定价页与帮助中心完成隧道与密钥配置。

若要在同一台云 Mac 上运行 UI 优先、20 分钟自动同步 的桌面智能体（Obsidian 记忆树），请参阅OpenHuman macOS 安装与记忆树指南。

常见问题

零 API 成本是否等于零花费？

可避免按 token 的 LLM 费用；电费、硬件或云租用仍可能存在。

能否完全不配云端 LLM Key？

使用 ollama 时 LLM API Key 可选；部分行情数据源仍可能需要在仓库 .env.example 中配置。

输出是否构成投资建议？

否——TradingAgents 为研究框架，行动前请阅读项目免责声明。

若计划为本地 LLM 吞吐升级硬件，可先读苹果 M5 Fusion 与 M6 2nm 传闻对比中的内存带宽分层与买现役/等跨代矩阵。

若本地 LLM 受 64 GB 缺货卡住，可先读 WWDC 2026 M5 Mac Mini 内存危机与 8 行决策矩阵，再决定是租云 Mac 还是等 BTO。

若 Ollama Agent 因巨型工具 JSON 卡顿而非 API 费用，请在进模型前经 Headroom 路由。参阅 Headroom + Ollama 本地加速实操，在 Mac mini 上压缩 60–95% 上下文。

在真 macOS 上 24/7 跑 TradingAgents

租用云 Mac mini M4，保持 Ollama 热机，SSH 批量分析，避免笔记本过热降频。

查看 Mac mini 套餐 SSH 与配置指南