AI Frontier

TradingAgents mit Ollama auf Mac mini M4 in 2026: null API-Kosten, Modell-Splits und Cloud-Staging

MacHTML Lab2026.05.25 ~28 Min. Lesezeit
TradingAgents Ollama Mac mini M4 null API-Kosten Setup 2026

TradingAgents ist ein Multi-Agent-LLM-Trading-Research-Framework — Analystenteams, Bull/Bear-Debatten, Trader, Risiko, Portfolio — auf LangGraph. Mit Ollama auf einem Mac mini M4 in 2026 bleibt die Inferenz lokal unter http://localhost:11434/v1, ohne Cloud-API-Token-Rechnungen (0 $ marginaler LLM-Aufwand nach der Hardware). Dieser Leitfaden deckt Installation, llm_provider: "ollama", Dual-Modell-RAM-Splits, Docker vs. nativ und Staging auf einem gemieteten Cloud-Mac-mini (~16,9 $/Tag).

Kombinieren Sie mit OpenClaw-Webhooks und Ollama für Automatisierung und Mac-mini-M4-Cloud-Leistung für Hardware-Kontext. Offizielle Quellen: TradingAgents auf GitHub, Ollama-Dokumentation und Apple Mac-mini-Specs.

Offenlegung: MacHTML stellt den in diesem Artikel genannten Cloud-Mac-mini-Mietdienst bereit.

Warum Ollama auf M4 für TradingAgents

Jede Ticker-Analyse kann 4–8 LLM-Aufrufe über Debattier-Runden auslösen. Cloud-APIs multiplizieren Kosten; Ollama auf Apple Silicon liefert OpenAI-kompatiblen Chat auf Port 11434. TradingAgents v0.2.5+ akzeptiert llm_provider: "ollama" mit optionalem OLLAMA_BASE_URL für Remote-Hosts.

Der Leerlaufverbrauch des Mac mini M4 liegt oft bei 6–12 W — günstiger als ein Laptop mit Volllüfter bei nächtlichen Batch-Läufen.

Hardware und RAM-Stufen

Unified RAMdeep_think_llmquick_think_llmLeitplanken
16 GBllama3.1:8bllama3.2:3bmax_debate_rounds=1
24 GBqwen2.5:14bllama3.2:3bStandard-Research-Tier
32 GB+qwen2.5:32b (Q4)llama3.1:8bLängere Analysten-Ketten

Apple listet bis zu 32 GB Unified Memory auf der Mac-mini-Specs-Seite.

TradingAgents und Ollama installieren

brew install ollama
ollama pull llama3.1:8b
ollama pull llama3.2:3b

git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents
python3.13 -m venv .venv && source .venv/bin/activate
pip install .

Ollama-Modell-Split-Strategie

deep_think_llm übernimmt Synthese und Debatten; quick_think_llm schnelles Routing. Weisen Sie auf 16 GB nicht dasselbe große Quant beiden Slots zu — OOM mit Exit-Code 137.

llm_provider ollama konfigurieren

config = DEFAULT_CONFIG.copy()
config["llm_provider"] = "ollama"
config["deep_think_llm"] = "llama3.1:8b"
config["quick_think_llm"] = "llama3.2:3b"
config["max_debate_rounds"] = 1

ta = TradingAgentsGraph(debug=True, config=config)
_, decision = ta.propagate("AAPL", "2026-05-20")

Remote-Ollama auf einem anderen Mac mini: export OLLAMA_BASE_URL=http://10.0.0.5:11434/v1.

CLI und erste Analyse

tradingagents   # Ollama + Modell-IDs interaktiv wählen

Rechnen Sie mit 5–20 Minuten pro Ticker auf M4 16 GB mit 8B/3B-Splits — Latenz gegen 0 $ Token-Ausgaben.

Docker-Profil ollama

docker compose --profile ollama up -d --build
docker compose --profile ollama run --rm tradingagents-ollama

Nativ Ollama + venv ist auf Apple Silicon für tägliche Research-Loops meist schneller als Docker.

Cloud-Mac-mini-Staging

Laptops drosseln thermisch bei stundenlangen Graphen. Ein gemieteter Apple-Silicon-Mac mini bietet 24/7 Ollama-Uptime und SSH-Batchs für etwa 16,9 $/Tag laut veröffentlichter MacHTML-Preise — weniger als ungenutztes Metall für ein Zwei-Wochen-Experiment.

FAQ

Bedeutet null API-Kosten null Ausgaben?

Sie vermeiden Token-LLM-Rechnungen; Strom, Hardware oder Cloud-Miete bleiben.

TradingAgents ohne Cloud-LLM-Keys?

Mit ollama sind LLM-API-Keys optional; manche Marktdaten-Anbieter brauchen weiter Keys — siehe .env.example im Repo.

Ist das Finanzberatung?

Nein — TradingAgents ist ein Research-Framework; lesen Sie den Projekt-Disclaimer vor Handlungen.

Vor einem Hardware-Upgrade für lokale LLMs lesen Sie M5 Pro Fusion vs. M6-2nm-Leaks zu Speicherbandbreite und Kauf-oder-Warten-Matrix.

Blockieren 64-GB-Engpässe lokale LLMs, lesen Sie WWDC 2026 M5 Mac mini DRAM-Krise und 8-Zeilen-Matrix vor TradingAgents.

Wenn Ollama-Agenten bei Megabyte-Tool-JSON hängen—nicht wegen API-Kosten—leiten Sie den Traffic vor dem Modell durch Headroom. Siehe Headroom + Ollama lokale Latenz für 60–95 % Kontextverkleinerung auf Mac mini.

TradingAgents 24/7 auf echtem macOS

Mieten Sie einen Cloud-Mac-mini M4, halten Sie Ollama warm, batchern Sie Ticker per SSH und vermeiden Sie Laptop-Thermal-Throttling.

TradingAgents auf Mac
Ab 16,9 $/Tag