AI Frontier

2026 Mac mini M4 上跑 TradingAgents + Ollama:零 API 成本、双模型分流与云 Mac 演练

MacHTML Lab2026.05.25 约 28 分钟阅读
TradingAgents Ollama Mac mini M4 零 API 成本 2026

TradingAgentsTauricResearch)是基于 LangGraph 的多智能体交易研究框架:分析师团队、多空辩论、交易员、风控与组合管理。在 Mac mini M4 上用 Ollama 本地推理(http://localhost:11434/v1),可把边际 LLM 费用压到 ¥0 / $0(按 token 的云端 API 不再计费)。本文覆盖安装、llm_provider: "ollama"、16GB/24GB 双模型分流、docker compose --profile ollama,以及租用云 Mac(约 ¥120/天$16.9/天)做 24/7 批跑。

若你还要把行情钩子接到自动化栈,可先读 OpenClaw Webhook 与 Ollama;硬件与远程办公场景见 Mac mini M4 远程办公。权威参考:Ollama 文档Apple Mac mini 规格

披露:本文提到的云 Mac mini 租用服务由 MacHTML 提供。

为何在 M4 上用 Ollama 跑 TradingAgents

单只股票分析常触发 4–8 次 LLM 调用(多轮辩论)。云端 API 按 token 叠加很快;Ollama 在 Apple Silicon 上以 OpenAI 兼容接口暴露 11434 端口。TradingAgents v0.2.5+ 支持 llm_provider: "ollama",远程实例可用 OLLAMA_BASE_URL 指向另一台 Mac mini。

M4 Mac mini 空闲功耗常见 6–12 W,比笔记本通宵跑图、风扇拉满更省电,适合把研究批处理迁到专用节点。

大陆开发者常见痛点(npm 与出口带宽)

在本地笔记本拉 TradingAgents 与 Python 依赖时,npm / PyPI 镜像不稳定会拖垮首日搭建;把环境放到海外或香港节点的云 Mac,用 SSH 在机房内网完成 pip install .,往往比反复折腾国内代理更省时。模型权重经 ollama pull 下载时,出口带宽与晚高峰抖动同样致命——建议在云 Mac 上一次性拉齐 llama3.1:8bllama3.2:3b,本地机器只跑客户端与 OLLAMA_BASE_URL 隧道。

团队合规场景下,行情与研报数据尽量留在租用实例磁盘,避免把未脱敏日志同步到个人网盘;MacHTML 节点可按项目隔离用户目录与 LaunchAgent。

硬件与 16GB / 24GB 双模型分流

统一内存deep_think_llmquick_think_llm建议
16 GBllama3.1:8bllama3.2:3bmax_debate_rounds=1
24 GBqwen2.5:14bllama3.2:3b默认研究档
32 GB+qwen2.5:32b(Q4)llama3.1:8b更长分析师链

Apple 官方 Mac mini 规格页 列出最高 32 GB 统一内存。切勿在 16GB 上把两个大模型同时塞进内存,否则 OOM(退出码 137)很常见。

安装 TradingAgents 与 Ollama

brew install ollama
ollama pull llama3.1:8b
ollama pull llama3.2:3b

git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents
python3.13 -m venv .venv && source .venv/bin/activate
pip install .

验证守护进程:curl -sS http://127.0.0.1:11434/api/tags。OpenAI 兼容面为 /v1,与 TradingAgents 默认一致。

配置 llm_provider ollama

config = DEFAULT_CONFIG.copy()
config["llm_provider"] = "ollama"
config["deep_think_llm"] = "llama3.1:8b"
config["quick_think_llm"] = "llama3.2:3b"
config["max_debate_rounds"] = 1

ta = TradingAgentsGraph(debug=True, config=config)
_, decision = ta.propagate("AAPL", "2026-05-20")

交互式:tradingagents 选择 Ollama 与模型 ID。M4 16GB + 8B/3B 组合下单票常见 5–20 分钟,换来 $0 token 账单。

Docker:docker compose --profile ollama

docker compose --profile ollama up -d --build
docker compose --profile ollama run --rm tradingagents-ollama

日常研究循环在 Apple Silicon 上通常 原生 Ollama + venv 比 Docker 更快;Docker 适合团队统一镜像与 CI 冒烟。

云 Mac mini 演练(MacHTML 租用)

笔记本长时间跑 LangGraph 易温控降频。租用 Apple Silicon Mac mini 可让 Ollama 24/7 在线,SSH 批量跑 ticker;公开价约 ¥120/天$16.9/天,两周实验往往低于闲置自购机器。结合 定价页帮助中心 完成隧道与密钥配置。

若要在同一台云 Mac 上运行 UI 优先、20 分钟自动同步 的桌面智能体(Obsidian 记忆树),请参阅OpenHuman macOS 安装与记忆树指南

常见问题

零 API 成本是否等于零花费?

可避免按 token 的 LLM 费用;电费、硬件或云租用仍可能存在。

能否完全不配云端 LLM Key?

使用 ollama 时 LLM API Key 可选;部分行情数据源仍可能需要在仓库 .env.example 中配置。

输出是否构成投资建议?

否——TradingAgents 为研究框架,行动前请阅读项目免责声明。

若计划为本地 LLM 吞吐升级硬件,可先读 苹果 M5 Fusion 与 M6 2nm 传闻对比 中的内存带宽分层与买现役/等跨代矩阵。

若本地 LLM 受 64 GB 缺货卡住,可先读 WWDC 2026 M5 Mac Mini 内存危机与 8 行决策矩阵,再决定是租云 Mac 还是等 BTO。

若 Ollama Agent 因巨型工具 JSON 卡顿而非 API 费用,请在进模型前经 Headroom 路由。参阅 Headroom + Ollama 本地加速实操,在 Mac mini 上压缩 60–95% 上下文。

在真 macOS 上 24/7 跑 TradingAgents

租用云 Mac mini M4,保持 Ollama 热机,SSH 批量分析,避免笔记本过热降频。

TradingAgents 云 Mac
约 ¥120/天 · $16.9 起