El 2 y 3 de junio de 2026, en San Francisco, Microsoft celebró su conferencia anual Build. Y esta vez no fue un Build cualquiera. Satya Nadella y su equipo presentaron MAI, una familia completa de modelos de inteligencia artificial construidos enteramente en casa. Sin depender de OpenAI. Sin destilar de modelos de terceros. Desde cero.
El buque insignia se llama MAI-Thinking-1, y es el primer modelo de razonamiento de Microsoft. Pero la jugada es mucho más grande que un solo modelo.
1. El contexto: ¿por qué Microsoft necesita sus propios modelos?
Microsoft lleva años siendo el principal socio y financista de OpenAI. Su nube Azure aloja los modelos de OpenAI. Su Copilot se ejecuta sobre GPT. Es una relación simbiótica… pero asimétrica. OpenAI tiene el modelo, Microsoft tiene la distribución.
En los últimos meses, esa dinámica ha cambiado. OpenAI ha lanzado sus propios productos enterprise compitiendo directamente con Copilot. Anthropic ha ganado terreno en coding con Claude Code. Google ha plantado cara con Gemini. Y todas las grandes tecnológicas han entendido lo mismo: quien no tiene su propio modelo, alquila inteligencia ajena.
Microsoft acaba de responder. Con siete modelos propios. Y con una filosofía que lo cambia todo.
2. MAI-Thinking-1: el modelo que piensa
MAI-Thinking-1 es un modelo de razonamiento (thinking/reasoning model) con arquitectura Mixture of Experts (MoE): 35 mil millones de parámetros activos sobre ~1 billón de parámetros totales, con una ventana de contexto de 256K tokens.
Traducción: es un modelo de tamaño medio que compite en la categoría de pesos pesados.
2.1 Los números que importan
| Benchmark | Puntuación | Comparación |
| AIME 25 (razonamiento matemático avanzado) | 97% | Nivel élite de razonamiento general |
| SWE-Bench Pro (ingeniería de software) | 53% | Empata con Claude Opus 4.6 |
| Surge AI (preferencia humana ciega) | Gana | Preferido a Claude Sonnet 4.6 en calidad global |
Lo más relevante no son solo los números, sino cómo se consiguieron. El modelo escaló «enteramente desde abajo» (hill-climbed from the bottom), sin apuntar específicamente a ningún benchmark y -esto es crítico – con cero destilación de modelos de terceros.
«This is critical. Because it means the model is created with an enterprise-grade, clean and commercially licensed data lineage that you can trust, and put into production with complete confidence.»
Esto diferencia a MAI-Thinking-1 de otros modelos del mercado que han sido acusados de entrenarse con outputs de GPT-4 o Claude. Microsoft puede garantizar que su modelo es limpio desde el punto de vista legal y de propiedad intelectual. Para clientes enterprise, eso es un argumento de venta demoledor.
2.2 Eficiencia: el caballo de batalla
MAI-Thinking-1 está diseñado para ser barato de servir. Microsoft lo posiciona como «el modelo de clase frontier más coste-eficiente en su categoría». En términos prácticos: potencia de razonamiento de primer nivel a coste de token reducido.
Y aquí entra el silicio propio. Microsoft ha co-diseñado el modelo con su chip Maia 200, logrando:
- +30% de mejora de rendimiento sobre la generación anterior
- 4x más rendimiento por vatio ejecutando MAI sobre Maia 200 frente a GPUs equivalentes
En lenguaje llano: Microsoft no solo hace el modelo, también hace el chip donde corre. Es la integración vertical completa: silicio → modelo → plataforma → producto.
3. Toda la familia MAI: siete modelos
MAI-Thinking-1 es la estrella, pero no viene solo. Microsoft anunció una familia completa:
| Modelo | Tipo | Estado | Dónde usarlo |
| MAI-Thinking-1 | Razonamiento (texto) | Private preview | Microsoft Foundry, Open Router, Fireworks, Baseten |
| MAI-Image-2.5 | Texto→imagen + imagen→imagen | GA | PowerPoint, OneDrive, Foundry |
| MAI-Image-2.5 Flash | Imagen eficiente | GA | Cargas de producción a escala |
| MAI-Transcribe-1.5 | Transcripción (43 idiomas) | GA | Copilot, Teams, GitHub, Dynamics 365 |
| MAI-Voice-2 | Generación de voz (15 idiomas) | GA | Foundry, MAI Playground |
| MAI-Voice-2 Flash | Voz ultraligera | GA | Agentes de voz en tiempo real |
| MAI-Code-1-Flash | Código (5B parámetros) | GA (VS Code) | GitHub Copilot, VS Code, CLI |
MAI-Code-1-Flash: el hermano pequeño que pega fuerte
Mención especial merece MAI-Code-1-Flash. Con solo 5 mil millones de parámetros (más cerca de un Haiku que de un Opus), alcanza el 51% en SWE-Bench Pro. Es más barato que Claude Haiku pero compite en rendimiento de código. Ya se está desplegando como modelo por defecto en VS Code.
MAI-Transcribe-1.5: el mejor del mundo en su clase
Microsoft afirma que es el mejor modelo de transcripción del mundo, con precisión state-of-the-art en 43 idiomas, superando a Gemini y OpenAI. Hasta 5x más rápido que modelos rivales. Se integra en Copilot, Teams, GitHub y Dynamics 365 Contact Centre.
4. Frontier Tuning: el verdadero game-changer
Aquí es donde la estrategia de Microsoft se diferencia radicalmente de OpenAI o Anthropic.
Frontier Tuning permite a las empresas tomar un modelo MAI y entrenarlo con sus propios datos, flujos de trabajo y conocimiento institucional, usando entornos de aprendizaje por refuerzo (RLEs) dentro de su propio tenant.
La diferencia fundamental con el modelo «alquilas inteligencia»:
| Enfoque tradicional (OpenAI, Anthropic) | Frontier Tuning (Microsoft) |
| Usas un modelo compartido que aprende de todos | El modelo se entrena solo con tus datos |
| No controlas el modelo resultante | Tú eres el dueño del modelo resultante |
| La inteligencia es un servicio que alquilas | La inteligencia se convierte en tu ventaja competitiva (moat) |
| Tus datos pueden filtrarse al modelo base | Tus datos se quedan en tu tenant |
En palabras del keynote:
«Unlike with some other companies, with MAI you don’t rent intelligence from a shared model that learns from everyone. Only you keep the benefits of your hard-earned workflows, know-how, data and institutional knowledge. Only you control the resulting model. The RLEs and the models you build inside of them become your moat.»
Resultados internos
- Un modelo MAI tuneado para Excel igualó a GPT-5.4 en benchmarks públicos y privados, siendo 10X más eficiente.
- McKinsey: MAI tuneado superó a GPT-5.5 en calidad, siendo 10X más barato.
El mensaje es claro: no necesitas el modelo más grande del mundo si tienes un modelo más pequeño entrenado específicamente para tu dominio.
5. Humanist Superintelligence: la filosofía detrás de MAI
Microsoft ha acuñado un término para su enfoque: Humanist Superintelligence. La idea es que la superinteligencia no consiste en reemplazar a los humanos, sino en amplificar sus capacidades.
En la práctica, esto se traduce en:
- Modelos diseñados para servir a personas y organizaciones, no para sustituirlas
- Las negativas inseguras (unsafe compliance) y los rechazos innecesarios (unnecessary refusal) se tratan como defectos en el mismo bucle de RL que la capacidad
- Seguridad reforzada en contenido sensible sin sacrificar utilidad (helpfulness)
- Protección de copyright incorporada
- Todos los outputs de voz llevan watermarking
- Protección contra clonación de voz no autorizada
- Transparencia total: informe técnico detallado publicado junto al lanzamiento
6. ¿Dónde y cómo probarlo?
MAI-Thinking-1
- Microsoft Foundry: private preview. Hay que solicitar acceso.
- Open Router, Fireworks, Baseten: próximamente disponible para desarrolladores.
- Por primera vez, Microsoft permitirá tunear los pesos directamente (no solo fine-tuning supervisado, acceso real a los weights).
MAI-Code-1-Flash
- Ya disponible en VS Code y GitHub Copilot como modelo por defecto.
MAI-Image-2.5
- Ya integrado en PowerPoint y OneDrive.
- Próximamente en Foundry.
MAI-Transcribe-1.5 y MAI-Voice-2
- Disponibles en Foundry y MAI Playground.
- Integración en curso con Copilot, Teams y GitHub.
7. El ecosistema completo: más allá de los modelos
Build 2026 no fue solo MAI. El ecosistema que Microsoft está construyendo alrededor de estos modelos es igual de relevante:
| Anuncio | Qué es |
| Microsoft Scout | Agente personal always-on para trabajo, construido sobre OpenClaw, con identidad Entra propia |
| Frontier Tuning | Entrenamiento de modelos MAI con datos empresariales en el tenant del cliente |
| Maia 200 + N1X | Silicio propio + NPU en Windows para ejecutar MAI localmente |
| Windows 365 for Agents | Cloud PCs para cargas de trabajo de agentes |
| Microsoft Execution Containers | Sandboxing nativo en Windows como runtime de agentes |
| Surface RTX Spark Dev Box | Portátil con NPU NVIDIA para ejecutar modelos de hasta 120B localmente |
| Microsoft Discovery | Plataforma agentiva para investigación científica (GA) |
| Mayo Clinic partnership | Co-desarrollo de un modelo frontier para salud |
8. Pros y contras
✅ Lo mejor de MAI-Thinking-1 y la familia MAI
- Independencia real: primer modelo de razonamiento de Microsoft construido íntegramente en casa. Sin depender de OpenAI, sin destilar de terceros. Limpio desde el punto de vista legal.
- Rendimiento competitivo en tamaño medio: 53% en SWE-Bench Pro con 35B parámetros activos es impresionante. Empata con Opus 4.6, que es un modelo mucho más grande y caro.
- Coste-eficiencia: diseñado para ser barato de servir. En benchmarks internos, modelos MAI tuneados son 10X más eficientes que GPT-5.4/5.5.
- Frontier Tuning: el verdadero diferenciador. Poder entrenar modelos sobre MAI con tus datos, en tu tenant, y ser dueño del modelo resultante, cambia las reglas del juego para empresas.
- Integración vertical total: silicio (Maia 200) → modelo (MAI) → plataforma (Foundry) → producto (Copilot, VS Code, Office). Nadie más tiene esto.
- Familia completa: no es solo un modelo de texto. Cubre imagen, voz, transcripción y código. Siete modelos que cubren todas las modalidades.
- Filosofía de seguridad integrada: unsafe compliance y unnecessary refusal como defectos en el mismo bucle de RL. Watermarking en voz. Protección de copyright. Informe técnico público.
- Disponibilidad amplia: Foundry, Open Router, Fireworks, Baseten. Y posibilidad de tunear pesos directamente.
❌ Lo peor de MAI-Thinking-1
- Private preview: MAI-Thinking-1 no está disponible para el público general. Hay que solicitar acceso y ser aceptado. El modelo «existe» pero no puedes usarlo hoy si no eres partner.
- Llega tarde al mercado de razonamiento: OpenAI, Anthropic y Google llevan meses o años con modelos de razonamiento en producción. MAI-Thinking-1 llega cuando el mercado ya está maduro.
- Tamaño de contexto limitado: 256K tokens es bueno, pero Claude y Gemini ya ofrecen 1M+. Para casos de uso de long context extremo, se queda corto.
- Benchmarks seleccionados: los números son buenos, pero Microsoft controla qué benchmarks publica. Faltan comparativas independientes exhaustivas en terceros benchmarks (MMLU, HumanEval, GPQA, etc.).
- Ecosistema incipiente: OpenAI tiene un ecosistema masivo de herramientas, wrappers, y desarrolladores. Anthropic tiene Claude Code y MCP. MAI empieza de cero.
- Dependencia de Azure/Foundry: aunque se anuncia en Open Router, el ecosistema MAI está profundamente integrado con Azure. Si no estás en Azure, la experiencia probablemente sea de segunda clase.
- Sin acceso abierto: no es open source ni open weights (aunque permiten tunear). Sigue siendo un modelo propietario.
- MAI-Code-1-Flash es pequeño: 5B parámetros y 51% en SWE-Bench Pro es impresionante para su tamaño, pero para tareas de código complejas, 51% puede no ser suficiente. Está pensado para ser rápido y barato, no para ser el mejor.
9. Cierre
MAI-Thinking-1 no es solo un modelo. Es una declaración de intenciones.
Microsoft llevaba años siendo el distribuidor de la inteligencia de OpenAI. Con MAI, dice: también sabemos construir la inteligencia. Y con Frontier Tuning, añade: y te ayudamos a construir la tuya.
La propuesta de valor es potente: modelos competitivos en rendimiento, significativamente más baratos de operar, entrenables con tus datos en tu infraestructura, con garantías legales sobre la procedencia de los datos de entrenamiento, y distribuidos a través de la plataforma cloud más grande del mundo.
Si Frontier Tuning cumple lo que promete -modelos tuneados que igualan o superan a los frontier a una fracción del coste -, Microsoft habrá cambiado las reglas del juego. Ya no se tratará de quién tiene el modelo más grande, sino de quién tiene el modelo más ajustado a tu negocio.
La era del «alquilas inteligencia» puede estar llegando a su fin. Bienvenidos a la era de «construyes tu propia inteligencia».
MAI y, sobre todo, Frontier Tuning desplazan la pregunta clave: ya no se trata de quién tiene el modelo más grande, sino de quién tiene el modelo mejor ajustado a su negocio. Pero entrenar un modelo con tus datos, en tu tenant y con garantías de gobierno no es un «sube el CSV y listo»: exige decidir qué procesos merecen un modelo propio, preparar los datos, diseñar la evaluación y mantener todo bajo control de seguridad y cumplimiento.
En Raona ayudamos a las organizaciones a convertir ese potencial en ventaja real: identificamos los casos de uso donde un modelo afinado paga la inversión, diseñamos la arquitectura de datos y evaluación sobre el ecosistema Microsoft – Foundry, Azure, Fabric – y acompañamos a los equipos para que la adopción sea sólida y medible, no una prueba de concepto que se queda en el cajón.
Si tu organización está mirando MAI, Frontier Tuning o los modelos propios y se pregunta por dónde empezar, hablémoslo. Sin humo. Te ayudamos a separar lo que ya es posible de lo que todavía es promesa, y a construir el primer caso de uso que de verdad mueve la aguja.
Fuentes verificadas (consultadas el 3 de junio de 2026 – todas oficiales de Microsoft o cobertura directa de Build 2026):
- MAI-Thinking-1 – Página oficial de Microsoft AI
- Microsoft Build 2026: MAI Keynote Transcript – Mustafa Suleyman
- Microsoft Build Live Blog – 2-3 junio 2026
- Mashable – «Microsoft launches new MAI family of AI models at Microsoft Build»
- Microsoft Build 2026 homepage



