Entre las principales características que incluye la nueva versión del chatbot de OpenAI, está la posibilidad de ver, oír y responder al usuario.
Hoy en día, es difícil hablar de tecnología o tendencias en el mundo digital sin mencionar a la inteligencia artificial y, sobre todo, a ChatGPT. El chatbot de la empresa OpenAI se ha convertido en una de las plataformas más utilizadas en el mundo, llegando a obtener una media de 100 millones de usuarios por día a pocas semanas de su lanzamiento.
Si bien en la actualidad la cifra se ha regularizado, no cabe duda de que esta herramienta de IA sigue siendo de las más populares en todos los ámbitos y cada vez más personas descubren su utilidad para diversas tareas. Es por ello que, en su interés por brindar mayores posibilidades a los usuarios que usan su chatbot, la empresa ha lanzado una nueva actualización para ChatGPT, la cual incluye novedosas habilidades.
¿En qué consisten estas características añadidas a la plataforma de inteligencia artificial? A continuación, te explicamos cuáles son y cómo pueden ser aprovechadas.
“Ver, oír y hablar” será posible
La principal función que se incluirá en ChatGPT es la capacidad de interpretar imágenes. Tal como mostró OpenAI a través de su cuenta oficial de Twitter, la versión para móviles iOS y Android del chatbot usará la misma tecnología impulsada por IA de la aplicación Be My Eyes. Esto hará que, mediante la cámara del celular y la red neural del sistema, se logre distinguir los elementos visuales presentes en las imágenes para resolver las consultas del usuario.
The underlying research — voice generation and image understanding — offers a glimpse at what much more advanced AI will be capable of in the future. Learn more about this update and our safety measures: https://t.co/uNZjgbR5Bm
— OpenAI (@OpenAI) September 25, 2023
Por otro lado, la plataforma también podrá “hablar” con las personas mediante su nueva función de voz. Esta herramienta utiliza el sistema de código abierto Whisper (de autoría de OpenAI), el cual ha sido entrenado por actores de voz profesionales para ofrecer un resultado más realista al de su competencia.
Gracias a esta nueva funcionalidad, la app móvil de ChatGPT podrá convertirse en una mejor versión de los asistentes de voz convencionales, como Siri, Google Assistant o Alexa. De hecho, los usuarios podrán escoger entre cinco voces distintas que se adaptan de mejor forma a situaciones específicas.
Si bien las nuevas posibilidades que ofrece ChatGPT son resaltantes, OpenAI lanzó una recomendación a sus usuarios.
"Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”, advierte la firma.
Además, la compañía indicó en una publicación de su blog oficial que Spotify −el popular servicio de streaming de música y audio− usará la nueva función de ChatGPT para “traducir algunos de sus podcast a idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados”.
Fecha y disponibilidad de las nuevas funciones de ChatGPT
Las funciones de reconocimiento de imágenes y voz están siendo integradas a ChatGPT de manera progresiva y OpenAI espera que estén disponibles para todos en las próximas dos semanas.
Sin embargo, es importante precisar que, en un inicio, estas nuevas herramientas sólo podrán ser utilizadas por los usuarios que estén suscritos al plan Enterprise y al plan ChatGPT Plus, cuyo precio es de US$20 mensuales y ofrece otros beneficios.
Por otro lado, la compañía también indicó que los usuarios de la versión gratuita podrán utilizar estas nuevas características un tiempo después de haber sido lanzadas.
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, toma fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, mencionó OpenAI.