(CNN) El nuevo modelo, llamado GPT-4o, es una actualización del anterior modelo GPT-4 de la compañía, que se lanzó hace poco más de un año. El modelo estará disponible para clientes sin suscripción de paga, lo que significa que cualquiera tendrá acceso a la tecnología más avanzada de OpenAI a través de ChatGPT.
Según la demostración realizada por la empresa el lunes, GPT-4o convertirá ChatGPT en un asistente personal digital capaz de entablar conversaciones habladas en tiempo real. También podrá interactuar mediante texto y «visión», lo que significa que podrá ver capturas de pantalla, fotos, documentos o gráficos subidos por los usuarios y mantener una conversación sobre ellos.
Mira Murati, directora de Tecnología de OpenAI, explicó que la versión actualizada de ChatGPT también tendrá capacidad de memoria, es decir, podrá aprender de conversaciones anteriores con los usuarios y realizar traducciones en tiempo real.
«Es la primera vez que damos un gran paso adelante en lo que respecta a la facilidad de uso», declaró Murati durante la demostración en directo desde la sede de la empresa en San Francisco. «Esta interacción se vuelve mucho más natural y mucho, mucho más fácil».
La nueva versión llega en un momento en que OpenAI trata de adelantarse a la creciente competencia en la carrera armamentística de la IA. Rivales como Google y Meta han estado trabajando para construir modelos lingüísticos cada vez más potentes que impulsen los chatbots y puedan utilizarse para llevar la tecnología de IA a otros productos.
El evento de OpenAI se celebró un día antes de la conferencia anual de desarrolladores I/O de Google, en la que se espera que anuncie actualizaciones de su modelo de IA Gemini. Al igual que el nuevo GPT-4o, Gemini de Google también es multimodal, lo que significa que puede interpretar y generar texto, imágenes y audio.
La actualización de OpenAI también se adelanta a los anuncios sobre IA que Apple hará el mes que viene en su Conferencia Mundial de Desarrolladores, y que podrían incluir nuevas formas de incorporar la IA a las próximas versiones de iPhone o iOS.
Por su parte, la última versión de GPT podría suponer una gran ayuda para Microsoft, que ha invertido miles de millones de dólares en OpenAI para integrar su tecnología de IA en los propios productos de Microsoft.
Los ejecutivos de OpenAI demostraron una conversación hablada con ChatGPT para obtener instrucciones en tiempo real para resolver un problema de matemáticas, contar un cuento antes de dormir y obtener consejos de codificación. ChatGPT fue capaz de hablar con una voz natural y humana, así como con una voz robótica, e incluso cantó parte de una respuesta. La herramienta también era capaz de mirar la imagen de un gráfico y discutir sobre él.
También mostraron que el modelo detectaba las emociones de los usuarios; en un caso, escuchó la respiración de un ejecutivo y le animó a calmarse.
«¡No eres una aspiradora!», le dijo bromeando al empleado la voz femenina de ChatGPT (que suena notablemente similar a la compañera digital con voz de Scarlett Johansson de la película «Her», de 2013).
ChatGPT también era capaz de mantener una conversación en varios idiomas traduciendo y respondiendo automáticamente. La herramienta admite ahora más de 50 idiomas, según OpenAI.
«El nuevo modo de voz (y video) es la mejor interfaz computacional que he utilizado», dijo Sam Altman, CEO de OpenAI, en una entrada de blog tras el anuncio. «Parece la IA de las películas; y todavía me sorprende un poco que sea real. Llegar a tiempos de respuesta y expresividad de nivel humano resulta ser un gran cambio».
Murati señaló que OpenAI lanzará una aplicación de escritorio ChatGPT con las capacidades de GPT-4o, lo que ofrecerá a los usuarios otra plataforma para interactuar con la tecnología de la empresa. GPT-4o también estará disponible para los desarrolladores que deseen crear sus propios chatbots personalizados desde la tienda GPT de OpenAI, una función que ahora también estará disponible para los usuarios sin suscripción.
La tecnología y las funciones actualizadas llegarán a ChatGPT en los próximos meses. Los usuarios sin suscripción pagada de ChatGPT dispondrán de un número limitado de interacciones con el nuevo modelo GPT-4o antes de que la herramienta vuelva automáticamente a depender del antiguo modelo GPT-3.5; los usuarios de pago tendrán acceso a un mayor número de mensajes con el último modelo.
OpenAI afirma que más de 100 millones de personas ya utilizan ChatGPT. Pero una experiencia ChatGPT actualizada, y la posibilidad de interactuar con ella en el escritorio y a través de conversaciones de voz mejoradas, podría dar aún más motivos a la gente para utilizar su tecnología.
Estos cambios se producen en un momento en el que la integración de la IA en productos de consumo más utilizados por Google y Meta, como Instagram y Google Assistant, puede hacer que la tecnología de esas empresas sea más amplia y fácilmente accesible.