🤖 Large Language Models

AlphaEvolve от DeepMind: LLM эволюционируют код для игр, превосходящий человеческие наработки

Все думали, что разработка алгоритмов MARL останется чисто человеческим ремеслом — с покерными партиями и досками у белой стены. AlphaEvolve от DeepMind ставит всё с ног на голову: LLM генерируют код, который уделывает экспертные базовые реализации.

Визуализация эволюции алгоритмов CFR в AlphaEvolve от DeepMind с покерными картами и фрагментами кода

⚡ Key Takeaways

  • AlphaEvolve использует LLM для эволюции кода MARL, обходя базовые CFR и PSRO в играх с неполной информацией.
  • Ключевое открытие: VAD-CFR адаптирует дисконты через EWMA волатильности, асимметрично бустит положительные сожаления.
  • Сдвиг парадигмы: от ручного дизайна к автоматизированным фабрикам — потенциал для быстрых прорывов в RL.
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by MarkTechPost

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.