AlphaEvolve de DeepMind : les LLM font évoluer du code surpassant les humains en théorie des jeux
On pensait tous que la conception d'algorithmes MARL resterait un artisanat humain, peaufiné lors de parties de poker et sur tableaux blancs. AlphaEvolve de DeepMind renverse la vapeur : les LLM font évoluer du code qui explose les références expertes.
⚡ Key Takeaways
- AlphaEvolve utilise les LLM pour faire évoluer du code MARL, surpassant les baselines CFR et PSRO sur jeux à info imparfaite.
- Découverte phare : VAD-CFR adapte les remises via EWMA de volatilité, boost asymétrique des regrets positifs.
- Changement de paradigme : adieu design manuel, bonjour usines automatisées — potentiel d'avancées fulgurantes en RL.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost