Hace un año ocurrió lo que muchos empezaron a llamar el "DeepSeek moment": un punto de inflexión que activó no solo modelos, sino una cadena entera de ingeniería, infraestructura y colaboración abierta. ¿Qué pasó desde entonces y por qué importa si trabajas en investigación, producto o política tecnológica?
Un mapa de actores y estrategias
China no solo produjo más modelos. Cambió la forma de trabajar. Empresas grandes, startups y laboratorios pasaron de pensar en modelos aislados a diseñar piezas reutilizables dentro de sistemas de ingeniería. ¿El resultado? Un ecosistema donde el open source es la primera opción para diseñar y desplegar.
- DeepSeek se consolidó como el actor más seguido en comunidades abiertas. Su R1 fue el catalizador que permitió que otras organizaciones desplegaran y validaran a gran escala.
- Alibaba impulsó a Qwen como una familia de modelos: múltiples tamaños, modalidades y actualizaciones constantes. Para mitad de 2025 Qwen lideraba en derivados: alrededor de 113k modelos usando Qwen como base y 200k repositorios etiquetando Qwen, muy por encima de Llama y DeepSeek.
- Tencent evolucionó de integrar modelos maduros a liberar capacidades propias bajo la marca Tencent Hunyuan (Tencent HY), enfocándose en visión, video y 3D.
- ByteDance eligió un enfoque selectivo: abrir componentes de alto valor mientras conserva ventajas en puntos de producto. Su ecosistema de apps alcanzó gran escala, por ejemplo Doubao superando 100 millones DAU a finales de 2025.
- Baidu, después de priorizar modelos cerrados, reingresó con releases abiertos como Ernie 4.5 y revitalizó PaddlePaddle junto con el chip Kunlunxin, que anunció su IPO el 1 de enero de 2026.
- Startups como Moonshot, Z.ai y MiniMax aceleraron rápido: Kimi K2, GLM-4.5 y MiniMax M2 entraron en rankings de modelos abiertos y algunas anunciaron IPOs durante 2025.
Investigación y herramientas comunitarias
Grupos como BAAI y Shanghai AI Lab redirigieron esfuerzos hacia toolchains, evaluación y despliegue: proyectos como FlagOpen, OpenDataLab y OpenCompass fortalecen la base, no persiguen solo records de benchmark. Es una apuesta por resiliencia y operatividad a largo plazo.
Infraestructura: cómputo, energía y despliegue
El cambio no es solo software. La estrategia nacional "East Data, West Compute" y la creación de 8 hubs de cómputo y 10 clústeres de data centers pusieron la base física. Datos públicos estiman cerca de 1590 EFLOPS de capacidad total en 2025, con crecimiento anual del compute inteligente alrededor de 43 por ciento.
Mejoras en eficiencia también importan: el PUE promedio cayó a aproximadamente 1.46, lo que significa infra más eficiente y menor costo por entrenamiento a gran escala. Estas cifras explican por qué desplegar modelos a gran escala dejó de ser solo una opción para gigantes con recursos ilimitados.
Qué cambió en términos técnicos
La novedad no es solo más parámetros ni un nuevo record. Es la transición hacia sistemas compuestos:
- Modelos como componentes reutilizables que se ensamblan en pipelines y agentes.
- Coordinación entre modelos, chips y frameworks: ejemplo concreto es la integración de modelos con Kunlunxin y PaddlePaddle.
- Rutas de entrenamiento más flexibles y despliegue localizable, pensadas para control, latencia y cumplimiento.
Esto implica que el diseño de sistemas hoy asume reusabilidad, composabilidad y auditabilidad desde el inicio. Para ingenieros significa cambiar prioridades: menos tuning por récord, más pruebas de integración y despliegue.
Implicaciones para desarrolladores y reguladores
Para ti que desarrollas: abrir artefactos significa acceso a piezas que puedes integrar, auditar y mejorar. Las métricas relevantes ya no son solo perplexity o SOTA en un benchmark, sino latencia de inferencia, costo por token, facilidad de composición y reproducibilidad.
Para quienes hacen política: una infraestructura nacional de cómputo y energía + un ecosistema abierto plantea preguntas nuevas sobre interoperabilidad, export controls y gobernanza compartida. El modelo chino muestra que abrir no es renunciar al control; es reconfigurar dónde y cómo se ejerce.
¿Hacia dónde va esto?
China en 2025 dejó de correr detrás de picos de performance para construir algo que funcione a escala: pipelines de entrenamiento, despliegue distribuido, stacks completos que combinan modelo, hardware y plataforma. El futuro inmediato parece orientado a:
- Mayor integración de IA en procesos industriales y agentes autónomos.
- Despliegues más localizados y controlables por empresas y gobiernos.
- Ecosistemas donde el valor viene de la orquestación, no solo del modelo central.
Preguntas abiertas que siguen siendo críticas: ¿cómo colaborará la comunidad global con un ecosistema chino cada vez más autosuficiente? ¿Qué estándares de gobernanza y auditoría serán necesarios para interoperar sin fricciones?
Al final, lo importante es que el open source dejó de ser una opción marginal para convertirse en la forma por defecto de diseñar sistemas de IA en China. No es magia; es ingeniería, infraestructura y acuerdos comunitarios que ya están cambiando cómo se construye y se entrega inteligencia artificial en el mundo.
Fuente original
https://huggingface.co/blog/huggingface/one-year-since-the-deepseek-moment-blog-3
