딥마인드 AlphaEvolve, LLM으로 게임 이론 코드 진화시켜 인간 설계 꺾었다
다들 MARL 알고리즘 설계는 인간의 영역이라고 봤다. 포커 파티와 화이트보드에서 다듬는 거지. 딥마인드 AlphaEvolve가 판을 뒤집었다. LLM이 전문가 기준을 깨부수는 코드를 진화시킨다.
⚡ Key Takeaways
- AlphaEvolve, LLM으로 MARL 코드 진화시켜 불완전 정보 게임 CFR·PSRO 기준 제침.
- 주요 발견: VAD-CFR, 변동성 EWMA로 할인 적응하고 긍정 후회 비대칭 증폭.
- 수동 설계에서 자동 팩토리로 패러다임 전환 — RL 급속 발전 잠재력.
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by MarkTechPost