AlphaEvolve от DeepMind: LLM эволюционируют код для игр, превосходящий человеческие наработки
Все думали, что разработка алгоритмов MARL останется чисто человеческим ремеслом — с покерными партиями и досками у белой стены. AlphaEvolve от DeepMind ставит всё с ног на голову: LLM генерируют код, который уделывает экспертные базовые реализации.
⚡ Key Takeaways
- AlphaEvolve использует LLM для эволюции кода MARL, обходя базовые CFR и PSRO в играх с неполной информацией.
- Ключевое открытие: VAD-CFR адаптирует дисконты через EWMA волатильности, асимметрично бустит положительные сожаления.
- Сдвиг парадигмы: от ручного дизайна к автоматизированным фабрикам — потенциал для быстрых прорывов в RL.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost