Inteligência artificial passa em “teste final”? Banco mede nível de acerto

Freepick

Pesquisadores de mais de 40 países, com participação brasileira, criaram um banco de dados que promete funcionar como um “teste final” para medir o avanço da inteligência artificial

ThisIsEngineering/Pexels

A ferramenta, chamada Humanity’s Last Exam (HLE) — ou “o último exame da humanidade” —, está disponível para uso público e teve seu funcionamento descrito na revista Nature. As informações foram divulgadas pelo Jornal da USP, da Universidade de São Paulo

Google DeepMind/Pexels

O HLE reúne 2.500 questões distribuídas em dezenas de áreas do conhecimento, como matemática, ciências naturais e humanidades. O objetivo é avaliar, com precisão, o nível de acerto de modelos de IA, incluindo os chamados LLMs , como o ChatGPT e Gemini

Matheus Bertelli/Pexels

“A ideia é essencialmente criar uma ferramenta para medir o avanço dos modelos de IA de hoje”, afirmou ao Jornal da USP a pesquisadora Emily de Oliveira Santos, do Instituto de Ciências Matemáticas e da Computação da USP

Sumaid pal Singh Bakshi/uNSPLASH

O banco de dados foi estruturado para avaliar diferentes tipos de habilidade — do conhecimento científico ao raciocínio aplicado. Segundo Emily, o HLE pode testar desde conhecimentos gerais e senso comum até competências mais complexas

Google DeepMind/Pexels

O projeto foi disponibilizado no site lastexam.ai com a proposta de subsidiar pesquisas e políticas públicas relacionadas à inteligência artificial

Steve Johnson/Unsplash