A nova voz da OpenAI promete agilidade e eficiência para os usuários

A OpenAI apresentou o GPT-Realtime-2, seu primeiro modelo de voz da classe GPT-5, que traz uma nova abordagem para conversas em tempo real. Essa tecnologia é capaz de lidar com interrupções e mudanças de assunto, ampliando a janela de contexto de 32 mil para 128 mil tokens. Isso garante que o software se mantenha coerente mesmo em diálogos longos. Agora, desenvolvedores podem ajustar o nível de processamento, desde o mínimo até “muito alto” (xhigh), conforme as necessidades de velocidade ou complexidade das tarefas. Um usuário pode interromper a IA em meio a uma frase, e o sistema reorganiza a resposta sem perder a linha de raciocínio.

Os custos para utilização do modelo principal são de US$ 32 por milhão de tokens de entrada e US$ 64 por milhão de tokens de saída. Além disso, a OpenAI lançou o GPT-Realtime-Translate, que traduz falas de mais de 70 idiomas em 13 opções diferentes sem pausas. Para quem precisa de transcrições contínuas, o GPT-Realtime-Whisper fornece texto em tempo real para legendas e anotações de reuniões, com cobrança de US$ 0,034 por minuto para tradução e US$ 0,017 para transcrição. Esses valores são voltados a facilitar fluxos de trabalho em que a voz substitui o teclado em ambientes profissionais.

O lançamento impacta diretamente o ecossistema da Apple em 2026, com o iOS 27 se preparando para um novo sistema de extensões para assistentes de terceiros. Desenvolvedores já estão utilizando permissões para rodar IAs conversacionais no painel do CarPlay. A integração é feita através do aplicativo Codex para Mac, que agora funciona em segundo plano com o Xcode 26.3. Para motoristas que precisam ditar comandos complexos enquanto dirigem, a latência reduzida permite que a IA compreenda o contexto antes mesmo da frase ser concluída.

A capacidade do modelo de realizar tarefas em segundo plano enquanto fornece avisos verbais curtos — como “deixe-me verificar isso” — elimina o silêncio desconfortável durante o processamento. Os três modelos já estão disponíveis para integração, transformando o mercado de interfaces de voz em uma camada de computação invisível que exige hardware capaz de manter conexões constantes e baixa latência.

A nova voz da OpenAI promete agilidade e eficiência para os usuários

Membro da Super Select:

Marcelo Vangrey

Adicionar comentário

Cancelar resposta

Posts recentes

Comentários

Arquivos

Categorias

Você também pode gostar

Membro da Super Select:

Marcelo Vangrey

Adicionar comentário

Posts recentes

Comentários

Arquivos

Categorias