Por David Tomas, publicado en 14 agosto 2024
ChatGPT 4o es la versión mejorada de ChatGPT 4, la cual es (mientras escribimos estas líneas) la versión más avanzada del chat de Inteligencia Artificial de OpenAI. Esto quiere decir que la base tecnológica de ChatGPT 4 y ChatGPT 4o es la misma, por lo que no podemos hablar de ChatGPT 5, pero esta última versión presenta algunas mejoras. De hecho, ChatGPT 4o es una auténtica revolución.
Por ahora, se puede utilizar en las versiones de pago del chatbot de OpenAI y de forma limitada también en la versión gratuita. Sin embargo, solo podemos disfrutar de sus avances relacionados con el formato texto, pues como verás más adelante, presenta una gran cantidad de novedades multiformato que deberemos esperar para poder experimentar.
Si te interesa saber más sobre este salto evolutivo, aquí te lo contamos todo para que veas de lo que es capaz.
Novedades de ChatGPT 4o
La principal característica que convierte a esta nueva versión en una revolución es el ser multimodal de forma nativa. Eso se refiere a que puede procesar tanto texto como audio, imágenes y vídeo, lo cual permite a los usuarios interactuar con la Inteligencia Artificial de una forma mucho más diversa.
Pero no solo admite este tipo de formatos, sino que también puede generarlos, concretamente el texto y la voz. En ese sentido, puede responder con voz y ofrecer, por ejemplo, diferentes tonos de voz en su respuesta. Incluso, distintos estados de ánimo, así como cantar y reírse.
Pero el procesamiento multimodal no se queda ahí. Por si fuera poco, esta versión 4o también es capaz de interpretar expresiones faciales y llevar a cabo doblajes en tiempo real manteniendo el tono del individuo. Incluso, puede reaccionar a diferentes cosas que le muestres y no tiene problema en que le interrumpas durante la conversación, pudiendo seguir perfectamente el hilo a pesar de ello.
Por otro lado, esta nueva versión también presenta una baja latencia, lo que permite dar respuestas con una mayor velocidad, contestando de forma prácticamente instantánea. Y es que, mientras que la versión 4 tarda en responder una media de alrededor de cinco segundos, la versión 4o tarda 320 milisegundos de media, pudiendo aumentar ese tiempo dependiendo de la pregunta. Este periodo de tiempo es similar al que tarda una persona humana en responder cuando mantiene una conversación, por lo que esta nueva versión puede conversar de una manera más natural.
¿Qué significa la letra “o” del nuevo modelo de ChatGTP?
La letra “o” de esta última versión de ChatGPT se debe al término “omnimodel”, que hace referencia a la capacidad de este modelo de entender todos los tipos de formato: texto, voz, imagen y vídeo.
Diferencias entre ChatGPT 4o y versiones anteriores
Velocidad en la interacción: como hemos dicho, la versión 4o ofrece respuestas con una latencia de, en promedio, 320 milisegundos. Mientras, en la versión 3.5 (la que se puede utilizar gratuitamente de forma ilimitada) la latencia promedio es de 2,8 segundos y en la versión 4 de 5,4 segundos. Por tanto, podemos decir que la versión 4o es instantánea, mientras que el resto no.
Inteligencia: la versión 4o tiene entre un 20% y un 30% menos de probabilidades de ofrecer información falsa que sus predecesoras.
Accesibilidad: a diferencia de ChatGPT 4, la versión 4o está disponible en la versión gratuita, aunque de forma limitada.
Multimodalidad: ChatGPT 4o puede procesar audio, vídeo, imagen y texto. Incluso, puede responder tanto con texto como con audio. Por su parte, la versión 4 solo admite texto e imagen, pudiendo responder únicamente con texto. Eso no quita para que las herramientas que funcionan con GPT4, como Copilot o DALL-E, sí puedan generar imágenes.