Microsoft: MAI-Thinking-1 y su familia de modelos propios

Nibaldo Pino Araya

| 12 mayo, 2026

El 2 y 3 de junio de 2026, en San Francisco, Microsoft celebró su conferencia anual Build. Y esta vez no fue un Build cualquiera. Satya Nadella y su equipo presentaron MAI, una familia completa de modelos de inteligencia artificial construidos enteramente en casa. Sin depender de OpenAI. Sin destilar de modelos de terceros. Desde cero.

El buque insignia se llama MAI-Thinking-1, y es el primer modelo de razonamiento de Microsoft. Pero la jugada es mucho más grande que un solo modelo.

1. El contexto: ¿por qué Microsoft necesita sus propios modelos?

Microsoft lleva años siendo el principal socio y financista de OpenAI. Su nube Azure aloja los modelos de OpenAI. Su Copilot se ejecuta sobre GPT. Es una relación simbiótica… pero asimétrica. OpenAI tiene el modelo, Microsoft tiene la distribución.

En los últimos meses, esa dinámica ha cambiado. OpenAI ha lanzado sus propios productos enterprise compitiendo directamente con Copilot. Anthropic ha ganado terreno en coding con Claude Code. Google ha plantado cara con Gemini. Y todas las grandes tecnológicas han entendido lo mismo: quien no tiene su propio modelo, alquila inteligencia ajena.

Microsoft acaba de responder. Con siete modelos propios. Y con una filosofía que lo cambia todo.

2. MAI-Thinking-1: el modelo que piensa

MAI-Thinking-1 es un modelo de razonamiento (thinking/reasoning model) con arquitectura Mixture of Experts (MoE): 35 mil millones de parámetros activos sobre ~1 billón de parámetros totales, con una ventana de contexto de 256K tokens.

Traducción: es un modelo de tamaño medio que compite en la categoría de pesos pesados.

2.1 Los números que importan

Benchmark	Puntuación	Comparación
AIME 25 (razonamiento matemático avanzado)	97%	Nivel élite de razonamiento general
SWE-Bench Pro (ingeniería de software)	53%	Empata con Claude Opus 4.6
Surge AI (preferencia humana ciega)	Gana	Preferido a Claude Sonnet 4.6 en calidad global

Lo más relevante no son solo los números, sino cómo se consiguieron. El modelo escaló «enteramente desde abajo» (hill-climbed from the bottom), sin apuntar específicamente a ningún benchmark y -esto es crítico – con cero destilación de modelos de terceros.

«This is critical. Because it means the model is created with an enterprise-grade, clean and commercially licensed data lineage that you can trust, and put into production with complete confidence.»

Esto diferencia a MAI-Thinking-1 de otros modelos del mercado que han sido acusados de entrenarse con outputs de GPT-4 o Claude. Microsoft puede garantizar que su modelo es limpio desde el punto de vista legal y de propiedad intelectual. Para clientes enterprise, eso es un argumento de venta demoledor.

2.2 Eficiencia: el caballo de batalla

MAI-Thinking-1 está diseñado para ser barato de servir. Microsoft lo posiciona como «el modelo de clase frontier más coste-eficiente en su categoría». En términos prácticos: potencia de razonamiento de primer nivel a coste de token reducido.

Y aquí entra el silicio propio. Microsoft ha co-diseñado el modelo con su chip Maia 200, logrando:

+30% de mejora de rendimiento sobre la generación anterior
4x más rendimiento por vatio ejecutando MAI sobre Maia 200 frente a GPUs equivalentes

En lenguaje llano: Microsoft no solo hace el modelo, también hace el chip donde corre. Es la integración vertical completa: silicio → modelo → plataforma → producto.

3. Toda la familia MAI: siete modelos

MAI-Thinking-1 es la estrella, pero no viene solo. Microsoft anunció una familia completa:

Modelo	Tipo	Estado	Dónde usarlo
MAI-Thinking-1	Razonamiento (texto)	Private preview	Microsoft Foundry, Open Router, Fireworks, Baseten
MAI-Image-2.5	Texto→imagen + imagen→imagen	GA	PowerPoint, OneDrive, Foundry
MAI-Image-2.5 Flash	Imagen eficiente	GA	Cargas de producción a escala
MAI-Transcribe-1.5	Transcripción (43 idiomas)	GA	Copilot, Teams, GitHub, Dynamics 365
MAI-Voice-2	Generación de voz (15 idiomas)	GA	Foundry, MAI Playground
MAI-Voice-2 Flash	Voz ultraligera	GA	Agentes de voz en tiempo real
MAI-Code-1-Flash	Código (5B parámetros)	GA (VS Code)	GitHub Copilot, VS Code, CLI

MAI-Code-1-Flash: el hermano pequeño que pega fuerte

Mención especial merece MAI-Code-1-Flash. Con solo 5 mil millones de parámetros (más cerca de un Haiku que de un Opus), alcanza el 51% en SWE-Bench Pro. Es más barato que Claude Haiku pero compite en rendimiento de código. Ya se está desplegando como modelo por defecto en VS Code.

MAI-Transcribe-1.5: el mejor del mundo en su clase

Microsoft afirma que es el mejor modelo de transcripción del mundo, con precisión state-of-the-art en 43 idiomas, superando a Gemini y OpenAI. Hasta 5x más rápido que modelos rivales. Se integra en Copilot, Teams, GitHub y Dynamics 365 Contact Centre.

4. Frontier Tuning: el verdadero game-changer

Aquí es donde la estrategia de Microsoft se diferencia radicalmente de OpenAI o Anthropic.

Frontier Tuning permite a las empresas tomar un modelo MAI y entrenarlo con sus propios datos, flujos de trabajo y conocimiento institucional, usando entornos de aprendizaje por refuerzo (RLEs) dentro de su propio tenant.

La diferencia fundamental con el modelo «alquilas inteligencia»:

Enfoque tradicional (OpenAI, Anthropic)	Frontier Tuning (Microsoft)
Usas un modelo compartido que aprende de todos	El modelo se entrena solo con tus datos
No controlas el modelo resultante	Tú eres el dueño del modelo resultante
La inteligencia es un servicio que alquilas	La inteligencia se convierte en tu ventaja competitiva (moat)
Tus datos pueden filtrarse al modelo base	Tus datos se quedan en tu tenant

En palabras del keynote:

«Unlike with some other companies, with MAI you don’t rent intelligence from a shared model that learns from everyone. Only you keep the benefits of your hard-earned workflows, know-how, data and institutional knowledge. Only you control the resulting model. The RLEs and the models you build inside of them become your moat.»

Resultados internos

Un modelo MAI tuneado para Excel igualó a GPT-5.4 en benchmarks públicos y privados, siendo 10X más eficiente.
McKinsey: MAI tuneado superó a GPT-5.5 en calidad, siendo 10X más barato.

El mensaje es claro: no necesitas el modelo más grande del mundo si tienes un modelo más pequeño entrenado específicamente para tu dominio.

5. Humanist Superintelligence: la filosofía detrás de MAI

Microsoft ha acuñado un término para su enfoque: Humanist Superintelligence. La idea es que la superinteligencia no consiste en reemplazar a los humanos, sino en amplificar sus capacidades.

En la práctica, esto se traduce en:

Modelos diseñados para servir a personas y organizaciones, no para sustituirlas
Las negativas inseguras (unsafe compliance) y los rechazos innecesarios (unnecessary refusal) se tratan como defectos en el mismo bucle de RL que la capacidad
Seguridad reforzada en contenido sensible sin sacrificar utilidad (helpfulness)
Protección de copyright incorporada
Todos los outputs de voz llevan watermarking
Protección contra clonación de voz no autorizada
Transparencia total: informe técnico detallado publicado junto al lanzamiento

6. ¿Dónde y cómo probarlo?

MAI-Thinking-1

Microsoft Foundry: private preview. Hay que solicitar acceso.
Open Router, Fireworks, Baseten: próximamente disponible para desarrolladores.
Por primera vez, Microsoft permitirá tunear los pesos directamente (no solo fine-tuning supervisado, acceso real a los weights).

MAI-Code-1-Flash

Ya disponible en VS Code y GitHub Copilot como modelo por defecto.

MAI-Image-2.5

Ya integrado en PowerPoint y OneDrive.
Próximamente en Foundry.

MAI-Transcribe-1.5 y MAI-Voice-2

Disponibles en Foundry y MAI Playground.
Integración en curso con Copilot, Teams y GitHub.

7. El ecosistema completo: más allá de los modelos

Build 2026 no fue solo MAI. El ecosistema que Microsoft está construyendo alrededor de estos modelos es igual de relevante:

Anuncio	Qué es
Microsoft Scout	Agente personal always-on para trabajo, construido sobre OpenClaw, con identidad Entra propia
Frontier Tuning	Entrenamiento de modelos MAI con datos empresariales en el tenant del cliente
Maia 200 + N1X	Silicio propio + NPU en Windows para ejecutar MAI localmente
Windows 365 for Agents	Cloud PCs para cargas de trabajo de agentes
Microsoft Execution Containers	Sandboxing nativo en Windows como runtime de agentes
Surface RTX Spark Dev Box	Portátil con NPU NVIDIA para ejecutar modelos de hasta 120B localmente
Microsoft Discovery	Plataforma agentiva para investigación científica (GA)
Mayo Clinic partnership	Co-desarrollo de un modelo frontier para salud

8. Pros y contras

✅ Lo mejor de MAI-Thinking-1 y la familia MAI

Independencia real: primer modelo de razonamiento de Microsoft construido íntegramente en casa. Sin depender de OpenAI, sin destilar de terceros. Limpio desde el punto de vista legal.
Rendimiento competitivo en tamaño medio: 53% en SWE-Bench Pro con 35B parámetros activos es impresionante. Empata con Opus 4.6, que es un modelo mucho más grande y caro.
Coste-eficiencia: diseñado para ser barato de servir. En benchmarks internos, modelos MAI tuneados son 10X más eficientes que GPT-5.4/5.5.
Frontier Tuning: el verdadero diferenciador. Poder entrenar modelos sobre MAI con tus datos, en tu tenant, y ser dueño del modelo resultante, cambia las reglas del juego para empresas.
Integración vertical total: silicio (Maia 200) → modelo (MAI) → plataforma (Foundry) → producto (Copilot, VS Code, Office). Nadie más tiene esto.
Familia completa: no es solo un modelo de texto. Cubre imagen, voz, transcripción y código. Siete modelos que cubren todas las modalidades.
Filosofía de seguridad integrada: unsafe compliance y unnecessary refusal como defectos en el mismo bucle de RL. Watermarking en voz. Protección de copyright. Informe técnico público.
Disponibilidad amplia: Foundry, Open Router, Fireworks, Baseten. Y posibilidad de tunear pesos directamente.

❌ Lo peor de MAI-Thinking-1

Private preview: MAI-Thinking-1 no está disponible para el público general. Hay que solicitar acceso y ser aceptado. El modelo «existe» pero no puedes usarlo hoy si no eres partner.
Llega tarde al mercado de razonamiento: OpenAI, Anthropic y Google llevan meses o años con modelos de razonamiento en producción. MAI-Thinking-1 llega cuando el mercado ya está maduro.
Tamaño de contexto limitado: 256K tokens es bueno, pero Claude y Gemini ya ofrecen 1M+. Para casos de uso de long context extremo, se queda corto.
Benchmarks seleccionados: los números son buenos, pero Microsoft controla qué benchmarks publica. Faltan comparativas independientes exhaustivas en terceros benchmarks (MMLU, HumanEval, GPQA, etc.).
Ecosistema incipiente: OpenAI tiene un ecosistema masivo de herramientas, wrappers, y desarrolladores. Anthropic tiene Claude Code y MCP. MAI empieza de cero.
Dependencia de Azure/Foundry: aunque se anuncia en Open Router, el ecosistema MAI está profundamente integrado con Azure. Si no estás en Azure, la experiencia probablemente sea de segunda clase.
Sin acceso abierto: no es open source ni open weights (aunque permiten tunear). Sigue siendo un modelo propietario.
MAI-Code-1-Flash es pequeño: 5B parámetros y 51% en SWE-Bench Pro es impresionante para su tamaño, pero para tareas de código complejas, 51% puede no ser suficiente. Está pensado para ser rápido y barato, no para ser el mejor.

9. Cierre

MAI-Thinking-1 no es solo un modelo. Es una declaración de intenciones.

Microsoft llevaba años siendo el distribuidor de la inteligencia de OpenAI. Con MAI, dice: también sabemos construir la inteligencia. Y con Frontier Tuning, añade: y te ayudamos a construir la tuya.

La propuesta de valor es potente: modelos competitivos en rendimiento, significativamente más baratos de operar, entrenables con tus datos en tu infraestructura, con garantías legales sobre la procedencia de los datos de entrenamiento, y distribuidos a través de la plataforma cloud más grande del mundo.

Si Frontier Tuning cumple lo que promete -modelos tuneados que igualan o superan a los frontier a una fracción del coste -, Microsoft habrá cambiado las reglas del juego. Ya no se tratará de quién tiene el modelo más grande, sino de quién tiene el modelo más ajustado a tu negocio.

La era del «alquilas inteligencia» puede estar llegando a su fin. Bienvenidos a la era de «construyes tu propia inteligencia».

MAI y, sobre todo, Frontier Tuning desplazan la pregunta clave: ya no se trata de quién tiene el modelo más grande, sino de quién tiene el modelo mejor ajustado a su negocio. Pero entrenar un modelo con tus datos, en tu tenant y con garantías de gobierno no es un «sube el CSV y listo»: exige decidir qué procesos merecen un modelo propio, preparar los datos, diseñar la evaluación y mantener todo bajo control de seguridad y cumplimiento.

En Raona ayudamos a las organizaciones a convertir ese potencial en ventaja real: identificamos los casos de uso donde un modelo afinado paga la inversión, diseñamos la arquitectura de datos y evaluación sobre el ecosistema Microsoft – Foundry, Azure, Fabric – y acompañamos a los equipos para que la adopción sea sólida y medible, no una prueba de concepto que se queda en el cajón.

Si tu organización está mirando MAI, Frontier Tuning o los modelos propios y se pregunta por dónde empezar, hablémoslo. Sin humo. Te ayudamos a separar lo que ya es posible de lo que todavía es promesa, y a construir el primer caso de uso que de verdad mueve la aguja.

Nibaldo Pino Araya

Experto en IA y análisis de datos con 7+ años de experiencia en la industria y 9 en academia, apasionado por la innovación tecnológica y especializado en soluciones avanzadas de machine learning, NLP y visión por computador en Raona.

Nibaldo Pino Araya

Compartir en Redes Sociales