CHATGPT PODERÁ RECEBER COMANDOS DE VOZ E IMAGEM. ENTENDA OS NOVOS RECURSOS.
Se você já utiliza o ChatGPT no seu dia a dia e o considera um amigo próximo, agora poderá interagir ainda mais com ele.
A OpenAI começou a lançar novos recursos de voz e imagem para seu popular chatbot com tecnologia de IA, que permitem que você tenha conversas mais naturais com o ChatGPT, falando com ele e mostrando imagens.
Isso permite mais maneiras de utilizar o ChatGPT nas rotinas diárias. Por exemplo, durante uma viagem, você pode enviar ao ChatGPT uma foto de um ponto de referência e conversar em tempo real sobre ele. Da mesma forma, em casa, você pode tirar fotos do conteúdo da sua geladeira e discutir ideias para refeições ou solicitar um passo a passo de receita.
Nas próximas semanas, a OpenAI lançará esses recursos para usuários Plus e Enterprise. A capacidade de voz estará disponível somente nos aplicativos móveis, enquanto a funcionalidade de imagem estará acessível em todas as plataformas.
Converse com o ChatGPT
Antes o ChatGPT só podia te escutar, agora ele também poderá te responder.
O novo recurso de voz permite que você converse com o ChatGPT, que agora pode responder de forma audível em uma das cinco vozes sintetizadas que você escolher.
Para utilizar a voz do ChatGPT, basta ir em Configurações → Novos recursos no aplicativo móvel e opte por conversas de voz. Em seguida, toque no botão do fone de ouvido localizado no canto superior direito da tela inicial e escolha sua voz preferida entre cinco vozes diferentes.
De acordo com a OpenAI, o recurso de voz usa um modelo avançado de conversão de texto em fala treinado em amostras de dubladores. Para reconhecimento de fala, utiliza o Whisper, o sistema de fala de código aberto da OpenAI.
Mostre ao ChatGPT uma ou mais imagens
Agora você também pode mostrar ao ChatGPT uma ou mais imagens para fornecer contexto visual e focar a conversa.
Por exemplo, você pode compartilhar a foto de uma bicicleta quebrada e pedir para o chatbot diagnosticar o problema e sugerir soluções. No celular, uma ferramenta de desenho permite circular ou apontar partes específicas de uma imagem.
Os recursos de imagem usam uma versão multimodal dos modelos GPT-3.5 e GPT-4 ajustados para raciocinar sobre entradas visuais. A OpenAI testou extensivamente os recursos de imagem quanto a riscos de segurança antes de implementá-los.
Implementação gradual e com foco na segurança
A OpenAI observou que está adotando uma abordagem gradual para implantar esses recursos.
A nova tecnologia de voz abre aplicações criativas, mas também riscos como a personificação de figuras públicas. Para mitigar riscos, a voz está atualmente limitada ao chat conversacional.
Para imagens, a OpenAI disse que limitou a capacidade do ChatGPT de analisar diretamente pessoas em fotos e desaconselha casos de uso de alto risco sem verificação.
Os novos recursos de voz e imagem do ChatGPT oferecem aos usuários uma maneira mais natural de interagir com o sistema de IA. E os usuários Plus e Enterprise já poderão experimentá-los nas próximas semanas.
Fonte: Search Engine Journal
Share this content:
Publicar comentário