🔬 AI Research

ADeLe угадывает производительность ИИ с точностью 88% — наконец-то бенчмарки, которые всё объясняют

Представьте: заранее знать, почему ваш ИИ споткнётся на задаче. ADeLe именно это и делает — с точностью 88% даже на монстрах вроде GPT-4o.

theAIcatchup Apr 07, 2026 2 min read

Read in: Deutsch English Español Français Italiano 日本語 한국어 Português (BR) Русский Türkçe

Радиальные графики профилей способностей, сравнивающие модели ИИ вроде GPT-4o из исследования ADeLe

⚡ Key Takeaways

ADeLe предсказывает поведение ИИ на неизвестных задачах с точностью 88% по шкале 18 базовых способностей. 𝕏
Раскрывает изъяны текущих бенчмарков — скрытые зависимости от навыков и узкие диапазоны сложности. 𝕏
Профили моделей показывают сильные и слабые стороны, открывая путь к умному выбору и развёртыванию ИИ. 𝕏

Published by

theAIcatchup

AI news that actually matters.

#ADeLe #AI abilities #AI benchmarks #AI evaluation #LLM benchmarks #LLM evaluation #Microsoft Research #model abilities #model capabilities

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Microsoft Research AI