Buscar
Cerrar este cuadro de búsqueda.

¿Qué es Chat GPT-4o y qué ofrece esta nueva versión?

Picture of Alexis Montañés
Alexis Montañés
| 14 mayo, 2024

La nueva iteración del modelo, denominada GPT-4o, representa una actualización del previo GPT-4 de OpenAI, lanzado recientemente. Este modelo estará disponible para todos los usuarios, incluidos aquellos que no tienen suscripción de pago, lo que democratiza el acceso a la tecnología avanzada de la compañía a través de ChatGPT.

De acuerdo con la demostración presentada por la empresa, GPT-4o transformará ChatGPT en un asistente personal digital capaz de sostener conversaciones habladas en tiempo real. Además, podrá interactuar mediante texto y «visión», permitiéndole analizar y discutir capturas de pantalla, fotos, documentos o gráficos proporcionados por los usuarios.

¿Qué es Chat GPT-4o?

GPT-4o marca un progreso significativo en la forma en que los seres humanos interactúan con las máquinas, al ser capaz de procesar y responder a información en formatos de texto, audio e imagen. Este modelo responde a entradas de audio en tan solo 320 milisegundos de promedio, equiparable al tiempo de reacción en conversaciones humanas.

Además, ha mejorado considerablemente en el manejo de texto y código en inglés, y muestra una comprensión más profunda en varios otros idiomas. GPT-4o también se destaca por su eficiencia y costo reducido en su uso a través de la API, particularmente en las funciones relacionadas con la visión y el análisis de audio.

 

 

¿Cuáles son sus novedades?

Este modelo permite tener interacciones en tiempo real mediante texto, audio e imágenes, con capacidades avanzadas de memoria y traducción en múltiples idiomas. La nueva versión, que llegará a ChatGPT en los próximos meses, promete una experiencia más natural y accesible, compitiendo con innovaciones de Google y Meta.

Percepción de emociones

Los ejecutivos de OpenAI demostraron las capacidades de ChatGPT en una conversación hablada, mostrando su habilidad para resolver problemas matemáticos, contar cuentos, dar consejos de codificación, y discutir gráficos, todo con una voz natural y humana, así como una voz robótica que incluso cantó.

Además, ChatGPT detectó emociones, como en un caso donde animó a un ejecutivo a calmarse al escuchar su respiración, demostrando un alto nivel de interacción emocional y personal.

Acepta entradas de texto, audio o vídeo

Ahora puede mantener conversaciones en más de 50 idiomas, traduciendo y respondiendo automáticamente. Su nuevo modo de voz y video proporciona una interfaz computacional avanzada que se asemeja a la IA de las películas. Sam Altman, CEO de OpenAI, destacó en un blog que los tiempos de respuesta y la expresividad de nivel humano representan un gran avance en la tecnología.

Interpretación de imágenes y audios

Mejora sus capacidades de visión, permitiéndole analizar imágenes y fotos para ofrecer información detallada. En demostraciones, la IA analizó una ecuación matemática y utilizó la cámara del móvil para identificar elementos en una habitación y la vestimenta del usuario durante una conversación entre chatbots.

Respuesta en formato texto, audio o vídeo

Razonamiento e inteligencia de codificación, estableciendo nuevos récords en capacidades multilingües, de audio y visión. Además, mejora significativamente en textos en otros idiomas, siendo mucho más rápido, con un promedio de 320 milisegundos, y un 50% más económico en la API, destacando en visión y comprensión de audio.

Aplicación de escritorio

Aunque la presentación principal fue ChatGPT-4o, la nueva aplicación de escritorio de la empresa tecnológica también llamó la atención. Su objetivo es facilitar a los programadores el acceso a las capacidades de inteligencia artificial para el desarrollo de software.

 

En conclusión, GPT-4o de OpenAI representa un hito en la evolución de la inteligencia artificial, facilitando una interacción más fluida y adaptable entre los humanos y las máquinas. Este modelo no solo mejora significativamente en términos de procesamiento de texto, audio e imagen, sino que también se hace accesible para un público más amplio al estar disponible gratuitamente. Con habilidades mejoradas en traducción multilingüe y percepción emocional, GPT-4o promete transformar ChatGPT en un asistente personal digital multifacético. Puedes conocer todas las diferencias entre ChatGPT-4o y ChatGPT-4.

Además, la integración de capacidades avanzadas de visión y audio refuerza su utilidad en una variedad de contextos, desde el desarrollo de software hasta la interacción cotidiana. Con estos avances, OpenAI no solo refuerza su posición en el campo de la inteligencia artificial, sino que también redefine las posibilidades de interacción tecnológica en el futuro cercano.

¡Contáctanos para comenzar!

En Raona, contamos con más de dos décadas de experiencia colaborando con grandes entidades. Hemos finalizado más de 100 proyectos y asistido a 200 empresas, lo que nos convierte en la compañía más premiada en proyectos de intranet en España. Ponte en contacto con nosotros y te ofreceremos asesoramiento sin ningún compromiso.




    Alexis Montañés

    Especialista en Digital Marketing enfocado en la innovación y los resultados. Apasionado por conectar con audiencias y generar valor mediante análisis de datos y campañas creativas. Priorizo una comunicación efectiva como objetivo principal de cualquier estrategia de digital marketing. Comprometido con el crecimiento sostenible de la marca y la adaptación a las últimas tendencias.

    Compartir en Redes Sociales