web counter A nova voz da OpenAI promete agilidade e eficiência para os usuários - Super Select
Home » A nova voz da OpenAI promete agilidade e eficiência para os usuários
Tecnologia, Hardware e PC

A nova voz da OpenAI promete agilidade e eficiência para os usuários

A OpenAI apresentou o GPT-Realtime-2, seu primeiro modelo de voz da classe GPT-5, que traz uma nova abordagem para conversas em tempo real. Essa tecnologia é capaz de lidar com interrupções e mudanças de assunto, ampliando a janela de contexto de 32 mil para 128 mil tokens. Isso garante que o software se mantenha coerente mesmo em diálogos longos. Agora, desenvolvedores podem ajustar o nível de processamento, desde o mínimo até “muito alto” (xhigh), conforme as necessidades de velocidade ou complexidade das tarefas. Um usuário pode interromper a IA em meio a uma frase, e o sistema reorganiza a resposta sem perder a linha de raciocínio.

Os custos para utilização do modelo principal são de US$ 32 por milhão de tokens de entrada e US$ 64 por milhão de tokens de saída. Além disso, a OpenAI lançou o GPT-Realtime-Translate, que traduz falas de mais de 70 idiomas em 13 opções diferentes sem pausas. Para quem precisa de transcrições contínuas, o GPT-Realtime-Whisper fornece texto em tempo real para legendas e anotações de reuniões, com cobrança de US$ 0,034 por minuto para tradução e US$ 0,017 para transcrição. Esses valores são voltados a facilitar fluxos de trabalho em que a voz substitui o teclado em ambientes profissionais.

O lançamento impacta diretamente o ecossistema da Apple em 2026, com o iOS 27 se preparando para um novo sistema de extensões para assistentes de terceiros. Desenvolvedores já estão utilizando permissões para rodar IAs conversacionais no painel do CarPlay. A integração é feita através do aplicativo Codex para Mac, que agora funciona em segundo plano com o Xcode 26.3. Para motoristas que precisam ditar comandos complexos enquanto dirigem, a latência reduzida permite que a IA compreenda o contexto antes mesmo da frase ser concluída.

A capacidade do modelo de realizar tarefas em segundo plano enquanto fornece avisos verbais curtos — como “deixe-me verificar isso” — elimina o silêncio desconfortável durante o processamento. Os três modelos já estão disponíveis para integração, transformando o mercado de interfaces de voz em uma camada de computação invisível que exige hardware capaz de manter conexões constantes e baixa latência.

Membro da Super Select:

Marcelo Vangrey

A minha jornada como Vangrey no universo dos games começou em 1994 com um Mega Drive e o incrivel Mortal Kombat 2! Seguida pelo Super Nintendo no universo dos lendários cartuchos 16in1 com Top Gear e companhia! Em 1998, conquistou seu primeiro PLAY 1 novamente com Mortal Kombat, dessa vez o MK4, e a partir daí, continuou explorando diversas plataformas. Comprando e vendendo, já passei por: Game Boy Color, PS2, PSP, PS3, Nintendo DS, 3DS, Xbox 360, PS4, PS4 Pro, PS5, Nintendo Switch 1 e 2, e pra finalizar - o Steam Deck =)

Adicionar comentário

Clique aqui para postar um comentário