🤖 Large Language Models

DeepMinds AlphaEvolve lässt LLMs überlegenen Spieltheoriecode evolieren – besser als menschliche Designs

Alle hielten MARL-Algorithmusdesign für reines Menschenhandwerk, geprägt von Pokerrunden und Whiteboards. DeepMinds AlphaEvolve dreht das um: LLMs evolieren Code, der Expertenbaselines zerlegt.

Visualisierung von DeepMind AlphaEvolve, das CFR-Algorithmen evolviert, mit Poker-Karten und Code-Snippets

⚡ Key Takeaways

  • AlphaEvolve nutzt LLMs, um MARL-Code zu evolieren – toppt CFR- und PSRO-Baselines bei unvollständigen-Info-Spielen.
  • Schlüsselentdeckung: VAD-CFR passt Discounts via Volatilitäts-EWMA an, boostet Positives asymmetrisch.
  • Paradigmenwechsel von manuellem Design zu automatisierten Fabriken – Potenzial für schnelle RL-Fortschritte.
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by MarkTechPost

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.