web counter Anthropic Claude apresenta teste que supera até inteligência artificial avançada - Super Select
Home » Anthropic Claude apresenta teste que supera até inteligência artificial avançada
Tecnologia, Hardware e PC

Anthropic Claude apresenta teste que supera até inteligência artificial avançada

O Anthropic Claude está gerando um dilema interessante para os recrutadores da área de tecnologia. Desde 2024, a equipe responsável pela otimização de desempenho da Anthropic vem utilizando testes técnicos para avaliar candidatos, mas agora enfrenta um desafio inusitado: suas próprias inteligências artificiais estão superando as habilidades dos humanos durante esses testes.

Conforme informações de Tristan Hume, que lidera a equipe, cada nova versão do assistente de IA da empresa tem exigido uma reformulação completa dos métodos de avaliação. O ponto crítico chegou quando, nas mesmas condições e limites de tempo, o Claude Opus 4 apresentou um desempenho superior ao de muitos candidatos humanos avaliados.

Mesmo com essa situação, ainda era possível identificar candidatos excepcionais, até que o Claude Opus 4.5 elevou ainda mais o nível, igualando-se até mesmo aos melhores talentos humanos participantes do processo seletivo. Essa evolução criou um paradoxo para a equipe de recrutamento.

A ironia dessa situação é notável: os laboratórios que desenvolvem ferramentas sofisticadas agora precisam lidar com o potencial de suas criações serem usadas para enganar seus próprios processos seletivos. Sem supervisão presencial, ficou quase impossível garantir que os candidatos não estivessem utilizando assistentes de IA para resolver os desafios propostos.

Esse problema da trapaça com IA já causa transtornos em escolas e universidades ao redor do mundo, conforme discutido em fóruns. Contudo, a Anthropic está em uma posição única para enfrentar esse desafio, pela compreensão profunda das capacidades e limitações de seus modelos.

A solução proposta por Hume foi criar um novo teste que se afaste da otimização de hardware e foque em aspectos onde as IAs atuais ainda não estão totalmente treinadas, tornando-o inovador o suficiente para confundir até mesmo assistentes avançados como o Claude.

A Anthropic também compartilhou o teste original e lançou um desafio: “Se você conseguir superar o Opus 4.5, adoraríamos ouvir de você”. Essa estratégia serve como um meio de recrutamento e como uma forma de avaliar as limitações dos modelos mais recentes.

Membro da Super Select:

Marcelo Vangrey

A minha jornada como Vangrey no universo dos games começou em 1994 com um Mega Drive e o incrivel Mortal Kombat 2! Seguida pelo Super Nintendo no universo dos lendários cartuchos 16in1 com Top Gear e companhia! Em 1998, conquistou seu primeiro PLAY 1 novamente com Mortal Kombat, dessa vez o MK4, e a partir daí, continuou explorando diversas plataformas. Comprando e vendendo, já passei por: Game Boy Color, PS2, PSP, PS3, Nintendo DS, 3DS, Xbox 360, PS4, PS4 Pro, PS5, Nintendo Switch 1 e 2, e pra finalizar - o Steam Deck =)

Adicionar comentário

Clique aqui para postar um comentário