AlphaEvolve de DeepMind: los LLM evolucionan código de teoría de juegos que supera diseños humanos
Todos pensaban que diseñar algoritmos MARL seguiría siendo un arte humano, pulido en noches de póker y pizarras. AlphaEvolve de DeepMind lo da vuelta: los LLM generan código que aplasta las baselines de expertos.
⚡ Key Takeaways
- AlphaEvolve usa LLM para evolucionar código MARL, superando baselines CFR y PSRO en juegos de información imperfecta.
- Descubrimiento clave: VAD-CFR adapta descuentos vía EWMA de volatilidad y potencia positivos de forma asimétrica.
- Cambia el paradigma de diseño manual a fábricas automatizadas —potencial para avances rápidos en RL.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost