ADeLe Acerta 88% nas Previsões de IA – Finalmente, Benchmarks que Explicam de Verdade
Imagina saber exatamente por que sua IA patina numa tarefa – antes dela acontecer. O ADeLe faz isso na lata, cravando 88% de acerto em previsões com feras como GPT-4o.
⚡ Key Takeaways
- ADeLe prevê desempenho de IA em tarefas inéditas com 88% de acerto, usando scores de 18 habilidades principais. 𝕏
- Expõe falhas nos benchmarks atuais, como dependências de skills escondidas e faixas de dificuldade limitadas. 𝕏
- Perfis de modelos revelam forças e fraquezas, abrindo caminho pra seleções e implantações de IA mais espertas. 𝕏
Worth sharing?
Get the best AI stories of the week in your inbox — no noise, no spam.
Originally reported by Microsoft Research AI