AlphaEvolve da DeepMind: LLMs Evoluem Código Superior em Teoria dos Jogos — Batendo Designs Humanos
Todo mundo achava que o design de algoritmos MARL ia continuar sendo papo de humano, refinado em noites de poker e rabiscando quadro branco. O AlphaEvolve da DeepMind vira o jogo: LLMs evoluem código que esmaga as baselines dos experts.
⚡ Key Takeaways
- AlphaEvolve usa LLMs pra evoluir código MARL, batendo baselines CFR e PSRO em jogos de info imperfeita.
- Descoberta chave: VAD-CFR adapta discounts via EWMA de volatilidade, turbinando positivos de forma assimétrica.
- Muda o paradigma de design manual pra fábricas automáticas — potencial pra avanços rápidos em RL.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost