🔬 AI Research

Внимание как распределение Гиббса: изящный математический трюк или прорыв для трансформеров?

Физики опять врываются в ИИ, уверяя, что механизмы внимания — это тайные распределения Гиббса. Доказательство выложено — но это глубокий инсайт или всего лишь поэзия вероятностей?

Иллюстрация механизма внимания, отображённого на вероятности распределения Гиббса

⚡ Key Takeaways

  • Веса внимания математически идентичны распределению Гиббса с энергиями из схожести запрос-ключи. 𝕏
  • Это переоткрытие, эхом 1980-х моделей на энергиях вроде машин Больцмана — не революция. 𝕏
  • Хайп превыше сути: элегантная теория без практического влияния на развёртывание трансформеров. 𝕏
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Towards AI

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.