🤖 Large Language Models

AlphaEvolve de DeepMind : les LLM font évoluer du code surpassant les humains en théorie des jeux

On pensait tous que la conception d'algorithmes MARL resterait un artisanat humain, peaufiné lors de parties de poker et sur tableaux blancs. AlphaEvolve de DeepMind renverse la vapeur : les LLM font évoluer du code qui explose les références expertes.

Visualisation de l'évolution des algorithmes CFR par AlphaEvolve de DeepMind avec cartes de poker et extraits de code

⚡ Key Takeaways

  • AlphaEvolve utilise les LLM pour faire évoluer du code MARL, surpassant les baselines CFR et PSRO sur jeux à info imparfaite.
  • Découverte phare : VAD-CFR adapte les remises via EWMA de volatilité, boost asymétrique des regrets positifs.
  • Changement de paradigme : adieu design manuel, bonjour usines automatisées — potentiel d'avancées fulgurantes en RL.
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by MarkTechPost

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.