ChatGPT aprimora voz para rivalizar com Gemini

A OpenAI está investindo no aprimoramento do assistente de voz do ChatGPT, visando superar a experiência oferecida pelo Gemini, do Google. Após o lançamento do ChatGPT Atlas, um navegador próprio para competir com o Google Chrome, a empresa volta seus esforços para otimizar o ChatGPT para Android, com foco em mensagens diretas, chats em grupo e um modo de voz renovado.
Aprimoramentos no Modo de Voz
O modo de voz atual do ChatGPT apresenta uma interface em tela cheia com animação simples e transcrição opcional do diálogo. Apesar de funcional, essa abordagem é considerada limitada, pois o usuário precisa encerrar a conversa por voz para acessar conteúdos como links, imagens, mapas ou previsões do tempo.
A OpenAI está testando um novo formato que permitirá o acesso a conteúdo avançado durante o diálogo por voz. Será possível conversar com a IA e visualizar respostas multimodais simultaneamente, de forma semelhante ao Gemini Live do Google. O novo sistema iniciará a conversa dentro da janela de chat, com botões dedicados para encerrar o diálogo ou silenciar o microfone. Essa mudança visa tornar o ChatGPT mais integrado e responsivo, eliminando transições desnecessárias.
Veja também:
Multimodalidade e Integração
A atualização representa um passo para tornar o ChatGPT verdadeiramente multimodal, combinando voz, texto e imagem em tempo real. A integração do modo de voz dentro do chat permitirá a visualização de mapas, links clicáveis, gráficos, tabelas de dados e cards interativos durante a conversa.
Concorrência no Mercado de IA
O ChatGPT e o Gemini se consolidaram como os principais assistentes de inteligência artificial generativa, com abordagens distintas. Enquanto o ChatGPT se destaca pela fluidez e criatividade na conversação, o Gemini foca no raciocínio lógico e análise multimodal.
O Google está integrando o Gemini em seus produtos, como Busca, Gmail, Docs e Sheets. A OpenAI, por sua vez, aposta na integração com dispositivos Apple, com previsão de lançamento no iOS 18.2.
Planos e Funcionalidades
O ChatGPT oferece diversos planos, incluindo o gratuito com acesso ao GPT-4o Mini e GPTs personalizados. Os planos pagos, como o Plus e o Team, oferecem acesso a modelos mais avançados, maior limite de mensagens e ferramentas adicionais.
O Gemini Advanced está incluído no plano Google One AI Premium, que oferece 2 TB de armazenamento em nuvem e acesso ao Gemini Pro 2.5.
O Futuro dos Assistentes de Voz
A disputa entre ChatGPT e Gemini impulsiona a inovação no mercado de assistentes de voz. A expectativa é que os assistentes se tornem cada vez mais completos, capazes de entender emoções, tom de voz e interagir de forma natural com os usuários. A integração com outros aplicativos e a capacidade de realizar tarefas complexas serão diferenciais importantes.
O mercado de IA generativa está em constante evolução, com espaço para diferentes plataformas e abordagens. A OpenAI busca reconciliar sua visão de IA avançada com as expectativas dos usuários, enquanto o Google aposta na integração com seus serviços e dispositivos.
