Freepick
Pesquisadores de mais de 40 países, com participação brasileira, criaram um banco de dados que promete funcionar como um “teste final” para medir o avanço da inteligência artificial
ThisIsEngineering/Pexels
A ferramenta, chamada Humanity’s Last Exam (HLE) — ou “o último exame da humanidade” —, está disponível para uso público e teve seu funcionamento descrito na revista Nature. As informações foram divulgadas pelo Jornal da USP, da Universidade de São Paulo
Google DeepMind/Pexels
O HLE reúne 2.500 questões distribuídas em dezenas de áreas do conhecimento, como matemática, ciências naturais e humanidades. O objetivo é avaliar, com precisão, o nível de acerto de modelos de IA, incluindo os chamados LLMs , como o ChatGPT e Gemini
Matheus Bertelli/Pexels
“A ideia é essencialmente criar uma ferramenta para medir o avanço dos modelos de IA de hoje”, afirmou ao Jornal da USP a pesquisadora Emily de Oliveira Santos, do Instituto de Ciências Matemáticas e da Computação da USP
Sumaid pal Singh Bakshi/uNSPLASH
O banco de dados foi estruturado para avaliar diferentes tipos de habilidade — do conhecimento científico ao raciocínio aplicado. Segundo Emily, o HLE pode testar desde conhecimentos gerais e senso comum até competências mais complexas
Google DeepMind/Pexels
O projeto foi disponibilizado no site lastexam.ai com a proposta de subsidiar pesquisas e políticas públicas relacionadas à inteligência artificial
Steve Johnson/Unsplash