CHATGPT PODERÁ RECEBER COMANDOS DE VOZ E IMAGEM. ENTENDA OS NOVOS RECURSOS.

Tecnologia

Se você já utiliza o ChatGPT no seu dia a dia e o considera um amigo próximo, agora poderá interagir ainda mais com ele.

A OpenAI começou a lançar novos recursos de voz e imagem para seu popular chatbot com tecnologia de IA, que permitem que você tenha conversas mais naturais com o ChatGPT, falando com ele e mostrando imagens.

Isso permite mais maneiras de utilizar o ChatGPT nas rotinas diárias. Por exemplo, durante uma viagem, você pode enviar ao ChatGPT uma foto de um ponto de referência e conversar em tempo real sobre ele. Da mesma forma, em casa, você pode tirar fotos do conteúdo da sua geladeira e discutir ideias para refeições ou solicitar um passo a passo de receita.

Nas próximas semanas, a OpenAI lançará esses recursos para usuários Plus e Enterprise. A capacidade de voz estará disponível somente nos aplicativos móveis, enquanto a funcionalidade de imagem estará acessível em todas as plataformas.

Converse com o ChatGPT

Antes o ChatGPT só podia te escutar, agora ele também poderá te responder.

O novo recurso de voz permite que você converse com o ChatGPT, que agora pode responder de forma audível em uma das cinco vozes sintetizadas que você escolher.

Para utilizar a voz do ChatGPT, basta ir em Configurações → Novos recursos no aplicativo móvel e opte por conversas de voz. Em seguida, toque no botão do fone de ouvido localizado no canto superior direito da tela inicial e escolha sua voz preferida entre cinco vozes diferentes.

De acordo com a OpenAI, o recurso de voz usa um modelo avançado de conversão de texto em fala treinado em amostras de dubladores. Para reconhecimento de fala, utiliza o Whisper, o sistema de fala de código aberto da OpenAI.

Mostre ao ChatGPT uma ou mais imagens

Agora você também pode mostrar ao ChatGPT uma ou mais imagens para fornecer contexto visual e focar a conversa.

Por exemplo, você pode compartilhar a foto de uma bicicleta quebrada e pedir para o chatbot diagnosticar o problema e sugerir soluções. No celular, uma ferramenta de desenho permite circular ou apontar partes específicas de uma imagem.

Imagem: OpenAI/divulgação

Os recursos de imagem usam uma versão multimodal dos modelos GPT-3.5 e GPT-4 ajustados para raciocinar sobre entradas visuais. A OpenAI testou extensivamente os recursos de imagem quanto a riscos de segurança antes de implementá-los.

Implementação gradual e com foco na segurança

A OpenAI observou que está adotando uma abordagem gradual para implantar esses recursos.

A nova tecnologia de voz abre aplicações criativas, mas também riscos como a personificação de figuras públicas. Para mitigar riscos, a voz está atualmente limitada ao chat conversacional.

Para imagens, a OpenAI disse que limitou a capacidade do ChatGPT de analisar diretamente pessoas em fotos e desaconselha casos de uso de alto risco sem verificação.

Os novos recursos de voz e imagem do ChatGPT oferecem aos usuários uma maneira mais natural de interagir com o sistema de IA. E os usuários Plus e Enterprise já poderão experimentá-los nas próximas semanas.

Fonte: Search Engine Journal

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *