AlphaEvolve di DeepMind: gli LLM evolvono codice superiore per la teoria dei giochi, battendo i design umani
Tutti pensavano che progettare algoritmi MARL fosse un'arte umana, perfezionata tra poker notturni e lavagne. AlphaEvolve di DeepMind rovescia la situazione: gli LLM evolvono codice che schiaccia i baseline degli esperti.
⚡ Key Takeaways
- AlphaEvolve usa LLM per evolvere codice MARL, superando baseline CFR e PSRO su giochi con info imperfetta.
- Scoperta chiave: VAD-CFR adatta sconti via EWMA volatilità, pompa positivi asimmetricamente.
- Cambia paradigma da design manuale a fabbriche automatiche — potenziale per avanzate RL rapide.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost