Usuario interactuando con ChatGPT mediante comandos de voz e imagen

La compañía matriz de ChatGPT ha dado un emocionante paso adelante al anunciar la integración de capacidades de voz e imagen en su plataforma de inteligencia artificial generativa. Hasta ahora, ChatGPT se había centrado en responder a indicaciones escritas, pero con estas nuevas funcionalidades, los usuarios podrán mantener conversaciones fluidas con la IA y, lo que es aún más impresionante, "mostrarle" visualmente de qué están hablando. En este artículo, exploraremos cómo estas innovaciones transformarán la forma en que interactuamos con la tecnología y cómo los gigantes de la industria están compitiendo por liderar la revolución de la IA generativa.


Las funcionalidades de voz e imagen se están implementando inicialmente en las versiones de pago de ChatGPT, lo que abre un mundo de posibilidades para sus usuarios. Ahora, podrás tomar una foto de un lugar icónico durante tus viajes y tener una conversación en tiempo real con ChatGPT sobre lo que hace que ese lugar sea tan interesante. ¿Te imaginas poder explorar cualquier rincón del mundo y obtener información valiosa instantáneamente?


Pero las utilidades no se detienen ahí. ¿Necesitas inspiración culinaria? Simplemente toma una foto del interior de tu refrigerador y ChatGPT te ofrecerá sugerencias de recetas basadas en los ingredientes que tienes disponibles. ¿Tus hijos necesitan ayuda con sus tareas de matemáticas? Captura una imagen de la tarea y la IA generativa estará lista para brindar asistencia en la resolución de problemas.


La implementación de estas funciones se llevará a cabo gradualmente, comenzando con los usuarios de ChatGPT Plus y Enterprise en las próximas semanas. Además, se espera que estas capacidades se extiendan a los sistemas operativos móviles de Apple y Google, lo que democratizará aún más el acceso a esta tecnología revolucionaria.

© Agence France-Presse