ChatGPT, el chatbot creado por la empresa OpenAI, ahora tendrá nuevas funciones para poder ver, oír y hablar con los usuarios. Cabe destacar que, hasta ahora, sólo se podía interactuar con esta IA de manera escrita.
Ahora, los usuarios de pago, podrán tener una conversación en voz alta. Mandar fotos, imágenes, capturas de pantalla y obtener respuestas específicas. Para la versión gratuita, estás funciones estarán disponibles tiempo después.
Las herramientas pueden tener diversos usos. La empresa apunta algunos:
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, anota la empresa en un comunicado.
Mientras que para ejemplificar cómo se puede usar la herramienta de voz, la empresa dice que se puede utilizar para “contar un cuento o resolver un debate”.
Para poder hablar con el chatbot, se podrán elegir entre cinco voces distintas. Además, mediante Whisper, se podrá convertir la voz del usuario a texto, y la compañía luego usa su nuevo modelo de conversión de texto a voz para la respuesta de la máquina.
“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad”.
Asimismo, la empresa reconoce la inseguridad que esto representa para sus usuarios, al poder verse envueltos en fraudes. Sin embargo, trabajan en ello.