Внимание как распределение Гиббса: изящный математический трюк или прорыв для трансформеров?
Физики опять врываются в ИИ, уверяя, что механизмы внимания — это тайные распределения Гиббса. Доказательство выложено — но это глубокий инсайт или всего лишь поэзия вероятностей?
⚡ Key Takeaways
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by Towards AI