La mayoría de equipos creen que están en un nivel 3 cuando están en un 2 con buena voluntad. Aquí va un autodiagnóstico rápido para saber dónde estás de verdad y por qué importa más de lo que parece.
Hay una diferencia enorme entre «usamos IA» y «tenemos una adopción madura». El problema es que desde dentro esa diferencia es muy difícil de ver.
Porque cuando un equipo de desarrollo tiene Copilot activo, varios ingenieros usando ChatGPT y cierta sensación de que las cosas van más rápido, es natural pensar que la adopción está avanzando. Y en cierto sentido lo está. Pero la cuestión relevante no es si avanza, es a qué velocidad, con qué solidez y hacia dónde.
Lo que sigue es un diagnóstico rápido. Lee las señales de cada nivel y sé honesto sobre cuáles reconoces en tu equipo. No se trata de etiquetarse, sino de saber desde dónde estás tomando decisiones.
Nivel 1. Uso reactivo: «cada uno hace la guerra por su cuenta»
Estás aquí si reconoces estas señales:
- No hay ningún criterio compartido sobre cuándo, cómo o para qué usar IA en el flujo de desarrollo. Cada ingeniero decide por su cuenta.
- Si le preguntas a tres personas del equipo «¿cómo usas la IA?», obtienes tres respuestas completamente distintas.
- No existe ninguna métrica, ni siquiera aproximada, sobre el uso real, el impacto o los riesgos.
- La percepción de valor varía radicalmente de una persona a otra: hay quien la ve como imprescindible y quien ni la toca.
Lo que esto significa: hay curiosidad y experimentación, que es un punto de partida legítimo. Pero no hay capacidad organizativa. El valor depende al 100% del criterio individual, y eso no escala.
La trampa de este nivel: creer que la experimentación individual ya es adopción. No lo es. Es el paso previo.
Nivel 2. Uso asistido: «algunos equipos van bien, pero el conjunto es irregular»
Estás aquí si reconoces estas señales:
- Algunos equipos o personas han identificado casos de uso recurrentes (tests, documentación, refactors) y sacan valor con cierta consistencia.
- Empiezan a compartirse prácticas de forma informal («oye, prueba este prompt para generar tests»).
- Pero la adopción es desigual: hay equipos avanzados y otros que apenas la usan. No hay visión global.
- No existe gobernanza real. Nadie puede decir con datos dónde hay impacto y dónde hay riesgo.
Lo que esto significa: la organización ha superado la fase de experimentación individual y empieza a generar patrones. Pero esos patrones son frágiles, dependen de las personas, no del sistema.
La trampa de este nivel: confundir el entusiasmo de los equipos avanzados con madurez organizativa. Que algunos vayan bien no significa que el conjunto esté preparado para escalar.
Nivel 3. Uso integrado: «la IA ya forma parte del flujo de trabajo»
Estás aquí si reconoces estas señales:
- Hay casos de uso priorizados y los equipos saben en qué tareas la IA aporta más valor.
- Los procesos de revisión se han empezado a adaptar (no se revisa igual un refactor asistido por IA que un cambio crítico manual).
- Existen métricas iniciales: tiempo, calidad, adopción por equipo.
- Hay roles de referencia o equipos que lideran la adopción. Existe un backlog de mejoras.
Lo que esto significa: la IA ha dejado de ser una herramienta puntual y se está convirtiendo en parte del modelo de trabajo. Ya se puede empezar a hablar de impacto de forma estructurada.
La trampa de este nivel: pensar que ya está resuelto. El N3 es donde más organizaciones se estancan, porque hay suficiente progreso visible para relajarse pero no suficiente estructura para escalar sin fricción.
Nivel 4. Capacidad madura: «la IA es parte de cómo construimos software»
Estás aquí si reconoces estas señales:
- Hay gobernanza explícita: quién decide qué, con qué criterios, cómo se revisa.
- Las métricas son estables y se usan para tomar decisiones, no solo para reportar.
- Existen playbooks definidos y un sistema de aprendizaje continuo entre equipos.
- La organización puede comparar equipos, detectar asimetrías y actuar sobre ellas.
- Hay un roadmap de evolución por áreas y una reevaluación periódica de la adopción.
Lo que esto significa: la IA ya no es una herramienta que algunos usan bien. Es una capacidad operativa de la organización, tan estructural como el CI/CD o el modelo de revisión de código.
Realidad: muy pocas organizaciones están aquí hoy. Si crees que estás en N4, repasa las señales del N3. La mayoría de equipos que se perciben como N3 están realmente en un N2 avanzado.
El nivel no lo explica todo: las 5 dimensiones que completan el diagnóstico
Ahora bien, saber tu nivel es útil pero insuficiente. Dos organizaciones pueden estar en el «mismo nivel» y tener realidades muy distintas. Una puede haber avanzado mucho en generación de código pero no tener ningún criterio de gobernanza. Otra puede tener una estrategia clara pero no haberla traducido en prácticas reales dentro de los equipos.
Por eso, además del nivel, importa mirar en qué dimensiones estás construyendo esa madurez. Responde mentalmente a cada una:
Estrategia y gobierno. ¿Puedes explicar por qué tu organización quiere impulsar la IA en desarrollo, qué espera conseguir y qué riesgos no son aceptables? ¿O es un «todos lo hacen» sin dirección clara?
Entrega y desarrollo. ¿La IA está integrada en los flujos reales de trabajo (análisis, revisión, testing, documentación, despliegue) o se queda en generación de código y poco más?
Calidad y testing. ¿Se revisa lo que genera la IA con el mismo rigor que antes? ¿O la velocidad ha hecho que se bajen estándares sin que nadie lo diga explícitamente?
Operación y observabilidad. ¿La IA ayuda también a operar (incidentes, docs operativas, mejora continua) o solo a construir?
Personas y adopción. ¿Hay formación, espacios para compartir prácticas y liderazgo activo? ¿O cada persona evoluciona por su cuenta y el gap entre los que saben y los que no se agranda?
Tu scorecard rápido
Si has podido responder con datos concretos a las preguntas de las 5 dimensiones, probablemente estés en un N3 sólido. Si la mayoría de respuestas dependían de tu intuición o de lo que «crees que pasa», estás más cerca de un N1-N2, aunque la actividad sugiera lo contrario.
Y eso no es un problema de interés ni de intención. Es un problema de visibilidad. Que es, precisamente, lo primero que hay que resolver.


