OpenAI ha dado un paso decisivo en la evolución de la inteligencia artificial con el lanzamiento de GPT‑4.5, internamente conocido como “Orion”. Este modelo, el más grande y avanzado jamás desarrollado por la compañía, se lanza en formato de research preview y ya está disponible para usuarios Pro y desarrolladores en todo el mundo. En las próximas semanas, se espera que su acceso se expanda a planes Plus, Team, Enterprise y Edu.
En este artículo, exploramos en profundidad las características técnicas, mejoras revolucionarias y desafíos que plantea GPT‑4.5, un hito que no solo amplía la base de conocimientos de la IA, sino que también transforma la experiencia conversacional.
Una Nueva Era en el Escalado del Aprendizaje No Supervisado
GPT‑4.5 se apoya en dos pilares fundamentales:
- Aprendizaje no supervisado: Al incrementar la cantidad de datos y recursos computacionales durante la fase de pre-entrenamiento, este modelo mejora notablemente su capacidad para reconocer patrones y establecer conexiones, ampliando su base de conocimientos y reduciendo significativamente la tasa de alucinaciones. El resultado es una inteligencia que comprende el mundo con mayor exactitud.
- Optimización post-entrenamiento: Gracias a innovaciones en arquitectura y optimización, GPT‑4.5 refina sus respuestas sin depender de procesos de razonamiento explícitos. Esta optimización se traduce en respuestas más naturales, coherentes y fluidas, acercándose a la experiencia de una conversación humana.
Entrenado en las potentes supercomputadoras de Microsoft Azure, GPT‑4.5 garantiza robustez y una comprensión profunda del contexto, lo que lo hace especialmente eficaz para tareas complejas.
Sam Altman definió GPT‑4.5 como “un modelo gigante y costoso” que pone fin a la era de los modelos sin cadena de pensamiento, abriendo el camino para la integración de capacidades de razonamiento estructurado en futuras versiones, como GPT‑5.
Mejoras Clave: Conversación, Precisión y Creatividad
Interacción Natural y Refinada
Los primeros tests han revelado que interactuar con GPT‑4.5 es como conversar con una persona reflexiva. El modelo no solo capta las sutilezas del lenguaje, sino que adapta su tono y estilo al contexto del usuario, facilitando tareas de redacción, asesoramiento y resolución de problemas cotidianos.
Base de Conocimientos Ampliada
Gracias a su enorme capacidad computacional, GPT‑4.5 incorpora una base de datos de información actualizada y precisa. Esto le permite abordar preguntas complejas y de diversos dominios con un grado de exactitud sin precedentes, superando a sus predecesores en evaluaciones académicas, pruebas multilingües y benchmarks de ciencia.
Reducción Significativa de Alucinaciones
Uno de los mayores desafíos en modelos anteriores era la tendencia a generar respuestas incorrectas o “alucinaciones”. GPT‑4.5 ha logrado reducir esta tasa al 37.1%, en comparación con el 61.8% de GPT‑4o, lo que se traduce en respuestas más confiables y consistentes.
Creatividad y Adaptación del Tono
El modelo destaca también por su capacidad para generar ideas creativas y adaptar el mensaje a la intención del usuario. Ya sea en la elaboración de contenido, en el diseño o en la solución de problemas, GPT‑4.5 demuestra una notable habilidad para integrar estética y lógica, ofreciendo soluciones que sorprenden por su originalidad y precisión.
Evaluación de Riesgos y Seguridad
La seguridad es un aspecto primordial en el desarrollo de GPT‑4.5. Según la system card publicada por OpenAI, el modelo fue sometido a evaluaciones rigurosas para medir riesgos en áreas clave, como:
- Contenido no permitido y Jailbreaks: Se han implementado mitigaciones que limitan la generación de contenido inadecuado y ataques de jailbreak.
- Errores del modelo: Se ha trabajado para minimizar las equivocaciones y mejorar la robustez de las respuestas.
- Preparedness Scorecard: Solo se despliegan modelos que alcanzan una puntuación post-mitigación «media» o inferior en áreas críticas como CBRN, ciberseguridad y persuasión.
Estas medidas se han aplicado mediante métodos tradicionales como Supervised Fine-Tuning (SFT) y Reinforcement Learning from Human Feedback (RLHF), combinados con innovadoras técnicas de supervisión. El resultado es un modelo que, a pesar de su tamaño y complejidad, no presenta un incremento significativo en riesgos de seguridad respecto a sus versiones anteriores.
Rendimiento y Detalles Técnicos
GPT‑4.5 supone un salto cualitativo en escalabilidad y eficiencia. Algunos aspectos técnicos destacados incluyen:
- Costo de Uso:
- $75 por millón de tokens de entrada.
- $37.50 por millón de tokens en caché.
- $150 por millón de tokens de salida.
Estos precios reflejan la alta demanda computacional del modelo y su capacidad para manejar tareas complejas.
- Benchmarks y Evaluaciones:
- En pruebas de SimpleQA, el modelo alcanzó una precisión del 62.5%, superando a sus predecesores.
- Ha mostrado mejoras consistentes en evaluaciones multilingües (MMMLU) y en tareas de coherencia y precisión en redacción y resolución de problemas.
- Se ha posicionado favorablemente en tests de razonamiento social y en el Elimination Game Benchmark, reafirmando su capacidad para gestionar consultas complejas.
Integración en ChatGPT y en la API
En ChatGPT
Los usuarios Pro ya pueden seleccionar GPT‑4.5 desde el selector de modelos en la web, aplicaciones móviles y de escritorio. Entre las nuevas funcionalidades destacan:
- Acceso a información actualizada: Con capacidad de búsqueda integrada.
- Soporte para cargas de archivos e imágenes: Mejorando la interacción multimodal.
- Uso de canvas: Para tareas de redacción y codificación, permitiendo una experiencia más rica y versátil.
En la API
Los desarrolladores pueden acceder a GPT‑4.5 a través de:
- Chat Completions API
- Assistants API
- Batch API
Estas interfaces soportan características avanzadas como llamadas a funciones, salidas estructuradas, streaming y procesamiento de entradas de imagen, posicionando a GPT‑4.5 como una herramienta esencial para aplicaciones que requieran alta inteligencia emocional y capacidad de ejecución en entornos colaborativos.
Perspectivas y Retos a Futuro
A pesar de sus avances, GPT‑4.5 plantea algunos desafíos:
- Costo y Consumo de Recursos: Su elevado precio por token y la alta demanda de GPUs podrían limitar su adopción inicial en ciertos sectores.
- Transición a Modelos de Razonamiento: Al ser el último modelo sin cadena de pensamiento, el mercado se prepara para GPT‑5, que integrará capacidades de razonamiento estructurado, lo que podría transformar significativamente la resolución de problemas complejos.
- Competencia en el Mercado: Con actores como DeepSeek y xAI Grok desarrollando modelos alternativos, la competencia en el campo de la IA se intensifica, impulsando una carrera hacia modelos más eficientes y robustos.
Conclusión
GPT‑4.5 representa un hito en la evolución de los modelos de lenguaje. Al combinar una base de conocimientos ampliada, interacciones naturales y una reducción significativa de errores, este modelo redefine lo que es posible en la conversación asistida por IA. Aunque su elevado costo y consumo de recursos plantean desafíos, las innovaciones introducidas sientan las bases para futuras integraciones que unificarán aprendizaje no supervisado y razonamiento estructurado.
En Raona, estamos entusiasmados por estas innovaciones y comprometidos a seguir impulsando soluciones tecnológicas de vanguardia que transformen los desafíos actuales en oportunidades para el futuro. La era de GPT‑4.5 nos invita a explorar nuevas fronteras en la automatización, la colaboración y la experiencia conversacional, preparándonos para el siguiente gran salto: GPT‑5.