DeepMinds AlphaEvolve lässt LLMs überlegenen Spieltheoriecode evolieren – besser als menschliche Designs
Alle hielten MARL-Algorithmusdesign für reines Menschenhandwerk, geprägt von Pokerrunden und Whiteboards. DeepMinds AlphaEvolve dreht das um: LLMs evolieren Code, der Expertenbaselines zerlegt.
⚡ Key Takeaways
- AlphaEvolve nutzt LLMs, um MARL-Code zu evolieren – toppt CFR- und PSRO-Baselines bei unvollständigen-Info-Spielen.
- Schlüsselentdeckung: VAD-CFR passt Discounts via Volatilitäts-EWMA an, boostet Positives asymmetrisch.
- Paradigmenwechsel von manuellem Design zu automatisierten Fabriken – Potenzial für schnelle RL-Fortschritte.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost