TradingAgents est un framework de recherche trading multi-agents LLM — équipes d'analystes, débats bull/bear, trader, risque, portefeuille — construit sur LangGraph. L'exécuter avec Ollama sur un Mac mini M4 en 2026 garde l'inférence locale sur http://localhost:11434/v1 et évite la facturation cloud par token (0 € de coût marginal LLM après le matériel). Ce guide couvre l'installation, llm_provider: "ollama", les splits RAM dual-modèles, Docker vs natif, et le staging sur un Mac mini cloud loué (~16,9 $/jour).
À combiner avec les webhooks OpenClaw et Ollama pour l'automatisation et la puissance cloud Mac mini M4 pour le contexte matériel. Références officielles : TradingAgents sur GitHub, documentation Ollama, et fiches techniques Mac mini Apple.
Divulgation : MacHTML fournit le service de location de Mac mini cloud mentionné dans cet article.
Pourquoi Ollama sur M4 pour TradingAgents
Chaque analyse de ticker peut déclencher 4 à 8 appels LLM sur les tours de débat. Les API cloud multiplient le coût ; Ollama sur Apple Silicon sert le chat compatible OpenAI sur le port 11434. TradingAgents v0.2.5+ accepte llm_provider: "ollama" avec OLLAMA_BASE_URL optionnel pour un hôte distant.
La consommation au repos du Mac mini M4 se situe souvent autour de 6 à 12 W — moins coûteux qu'un portable en plein ventilateur pendant des batchs nocturnes.
Matériel et paliers RAM
| RAM unifiée | deep_think_llm | quick_think_llm | Garde-fous |
|---|---|---|---|
| 16 Go | llama3.1:8b | llama3.2:3b | max_debate_rounds=1 |
| 24 Go | qwen2.5:14b | llama3.2:3b | Tier recherche par défaut |
| 32 Go+ | qwen2.5:32b (Q4) | llama3.1:8b | Chaînes analystes plus longues |
Apple indique jusqu'à 32 Go de mémoire unifiée sur la page specs Mac mini.
Installer TradingAgents et Ollama
brew install ollama
ollama pull llama3.1:8b
ollama pull llama3.2:3b
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents
python3.13 -m venv .venv && source .venv/bin/activate
pip install .
Stratégie de split de modèles Ollama
deep_think_llm gère la synthèse et les débats ; quick_think_llm gère le routage rapide. N'assignez pas le même gros quant aux deux emplacements sur 16 Go — OOM avec code de sortie 137.
Configurer llm_provider ollama
config = DEFAULT_CONFIG.copy()
config["llm_provider"] = "ollama"
config["deep_think_llm"] = "llama3.1:8b"
config["quick_think_llm"] = "llama3.2:3b"
config["max_debate_rounds"] = 1
ta = TradingAgentsGraph(debug=True, config=config)
_, decision = ta.propagate("AAPL", "2026-05-20")
Ollama distant sur un autre Mac mini : export OLLAMA_BASE_URL=http://10.0.0.5:11434/v1.
CLI et première analyse
tradingagents # choisir Ollama + IDs de modèles en interactif
Comptez 5 à 20 minutes par ticker sur M4 16 Go avec splits 8B/3B — la latence s'échange contre 0 € de tokens.
Profil Docker ollama
docker compose --profile ollama up -d --build
docker compose --profile ollama run --rm tradingagents-ollama
Ollama natif + venv est en général plus rapide sur Apple Silicon que Docker pour les boucles de recherche quotidiennes.
Staging Mac mini cloud
Les portables limitent thermiquement pendant des graphes d'une heure. Louer un Mac mini Apple Silicon donne une disponibilité 24/7 d'Ollama et des batchs SSH pour environ 16,9 $/jour sur les tarifs MacHTML publiés — moins qu'acheter du métal inutilisé pour une expérience de deux semaines.
FAQ
Coût API zéro signifie-t-il zéro dépense ?
Vous évitez la facturation LLM par token ; électricité, matériel ou location cloud restent en jeu.
TradingAgents sans clés LLM cloud ?
Avec ollama, les clés API LLM sont optionnelles ; certains fournisseurs de données marché peuvent encore en exiger — voir .env.example dans le dépôt.
Est-ce un conseil financier ?
Non — TradingAgents est un framework de recherche ; lisez l'avertissement du projet avant d'agir sur les sorties.
Avant un upgrade matériel pour LLM locaux, consultez M5 Pro Fusion vs fuites M6 2 nm pour la bande passante mémoire et la matrice acheter maintenant ou attendre.
Si vos LLM locaux sont bloqués par le manque de 64 Go, consultez WWDC 2026 Mac mini M5 : crise DRAM et matrice 8 lignes avant TradingAgents.
Si les tours Ollama bloquent sur des JSON outils géants—pas sur le coût API—routez via Headroom avant le modèle. Voir Headroom + Ollama latence locale pour réduire le contexte de 60 à 95 % sur Mac mini.
TradingAgents 24/7 sur un vrai macOS
Louez un Mac mini M4 cloud pour garder Ollama chaud, batcher des tickers en SSH et éviter la limitation thermique du portable.