🔬 AI Research

ADeLe Acerta 88% nas Previsões de IA – Finalmente, Benchmarks que Explicam de Verdade

Imagina saber exatamente por que sua IA patina numa tarefa – antes dela acontecer. O ADeLe faz isso na lata, cravando 88% de acerto em previsões com feras como GPT-4o.

Gráficos radiais de perfis de habilidades comparando modelos de IA como GPT-4o da pesquisa ADeLe

⚡ Key Takeaways

  • ADeLe prevê desempenho de IA em tarefas inéditas com 88% de acerto, usando scores de 18 habilidades principais. 𝕏
  • Expõe falhas nos benchmarks atuais, como dependências de skills escondidas e faixas de dificuldade limitadas. 𝕏
  • Perfis de modelos revelam forças e fraquezas, abrindo caminho pra seleções e implantações de IA mais espertas. 𝕏
Published by

theAIcatchup

AI news that actually matters.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Microsoft Research AI

Stay in the loop

The week's most important stories from theAIcatchup, delivered once a week.