🤖 Large Language Models

AlphaEvolve de DeepMind: los LLM evolucionan código de teoría de juegos que supera diseños humanos

Todos pensaban que diseñar algoritmos MARL seguiría siendo un arte humano, pulido en noches de póker y pizarras. AlphaEvolve de DeepMind lo da vuelta: los LLM generan código que aplasta las baselines de expertos.

Visualización de AlphaEvolve de DeepMind evolucionando algoritmos CFR con cartas de póker y fragmentos de código

⚡ Key Takeaways

  • AlphaEvolve usa LLM para evolucionar código MARL, superando baselines CFR y PSRO en juegos de información imperfecta.
  • Descubrimiento clave: VAD-CFR adapta descuentos vía EWMA de volatilidad y potencia positivos de forma asimétrica.
  • Cambia el paradigma de diseño manual a fábricas automatizadas —potencial para avances rápidos en RL.
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by MarkTechPost

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.