OpenAI da un paso grande hacia la IA abierta con GPT‑OSS, una familia de modelos de razonamiento que puedes descargar, ejecutar y ajustar a tu medida. ¿La promesa? Rendimiento cercano a sus modelos comerciales, pero con pesos abiertos y licencia flexible.
Lo esencial en 30 segundos
- Dos modelos: gpt‑oss‑120b y gpt‑oss‑20b, con pesos abiertos bajo licencia Apache 2.0.
- En razonamiento, el 120b roza a o4‑mini y el 20b se compara con o3‑mini en varias pruebas.
- Diseñados para uso práctico: 120b puede correr en una sola GPU de 80 GB; 20b apunta a entornos con 16 GB de memoria.
- 128k de contexto, herramientas (búsqueda web, Python), Structured Outputs y cadena de pensamiento (CoT) disponible para investigación y depuración.
- Compatibles con la Responses API y pensados para flujos agentic. Publicación: 5 de agosto de 2025. (openai.com)
¿Qué cambia para ti?
Si eres desarrollador independiente, ya no necesitas una granja de GPUs para prototipar agentes que llamen funciones o ejecuten código. Puedes iterar localmente, reducir latencia y controlar tu pila.
Si lideras un equipo o startup, tienes más opciones para balancear costo, rendimiento y privacidad. ¿Necesitas on‑prem por datos sensibles? Este movimiento de OpenAI abre la puerta sin renunciar a buenas métricas de razonamiento.
En empresas y sector público, la ecuación de riesgo cambia: pesos abiertos significan auditabilidad y soberanía de datos, pero también responsabilidad de aplicar salvaguardas propias.
Cómo están construidos
Ambos modelos usan arquitectura Transformer con Mixture‑of‑Experts (MoE). El 120b tiene 36 capas y activa ~5.1B de parámetros por token (con 128 expertos, top‑4 activos por token); el 20b usa 24 capas y ~3.6B activos. Atención densa y de ventana alternadas, GQA agrupada, RoPE y contexto nativo de hasta 128k. También incorporan cuantización MXFP4 para ajustar memoria y velocidad, y un nuevo tokenizador abierto: o200k_harmony
. (cdn.openai.com)
Traducción práctica: más cerebro cuando hace falta, menos cómputo cuando no; y suficiente eficiencia para correr en hardware alcanzable.
Rendimiento en evaluaciones
En AIME (2024 y 2025), MMLU, HLE y GPQA, el 120b supera a o3‑mini y se acerca a o4‑mini; el 20b compite sorprendentemente bien pese a su tamaño. En HealthBench, los gpt‑oss llegan a superar incluso a modelos propietarios en ciertos casos. Como siempre, no sustituyen criterio profesional. (openai.com, cdn.openai.com)
Seguridad y uso responsable
OpenAI sometió un 120b ajustado de forma adversaria a su Preparedness Framework (bio, ciber y auto‑mejora). Resultado: no alcanza el umbral de “Alta” capacidad en esas categorías; aun así, los pesos abiertos implican riesgos distintos y requieren controles adicionales del implementador. Además, aunque la CoT está disponible para investigación y monitoreo, no se recomienda mostrar cadenas de pensamiento a usuarios finales. (openai.com, cdn.openai.com)
Cómo probarlos hoy
- Lee el anuncio y la model card para conocer licencias, límites y buenas prácticas.
- Define el “esfuerzo de razonamiento” en tu sistema (
low
,medium
,high
) según la tarea: más velocidad o más precisión. - Integra con la Responses API para flujos agentic (llamadas a herramientas, ejecución de código y salidas estructuradas).
- Evalúa localmente con tus propios datos y métricas; si vas on‑prem, prepara salvaguardas de seguridad y monitoreo. (openai.com)
Preguntas rápidas
- ¿Es open source? Es “open‑weights” con licencia Apache 2.0: puedes descargar, usar y ajustar, pero recuerda las políticas de uso. (openai.com)
- ¿Corre en mi equipo? El 20b está pensado para entornos con ~16 GB de memoria; el 120b para una GPU de 80 GB. Ajusta expectativas según tu hardware y latencia. (openai.com, cdn.openai.com)
- ¿Y el tokenizador?
o200k_harmony
se libera junto a los modelos para facilitar compatibilidad y eficiencia. (cdn.openai.com)
Enlace y documentación oficial
- Anuncio y detalles técnicos: Introducing gpt‑oss
- Model card (PDF): gpt‑oss‑120b & gpt‑oss‑20b
Al final, GPT‑OSS aterriza una idea sencilla pero potente: más gente experimentando con IA de alto nivel, en sus propios términos. ¿La clave? Entender el poder que te da… y la responsabilidad que viene con él.