Olmo impulsa modelos auditables para sectores regulados

18 jun 2026Keryc Díaz4 minutos

Ai2 publicó un conjunto de recursos abiertos que permiten a empresas en sectores regulados construir modelos auditables y controlables sin partir de cero. ¿Qué pasa cuando un laboratorio te da no solo pesos, sino la receta completa -datos, código y arquitectura- para que puedas justificar cada decisión ante cumplimiento y auditoría?

Por qué AISquared eligió `Olmo`

AISquared desarrolló la familia Bolt a partir de Olmo para casos de uso empresariales como RAG, procesamiento documental y enrutamiento de modelos. Bolt Instruct se afina desde Olmo 2, Olmo 3 y Olmo 3.1 en tamaños 1B, 7B y 32B, y su elección no fue casual.

Para Jacob Renn, cofundador de AISquared, la diferencia principal es la visibilidad. Tener acceso completo a la arquitectura y a los datos de entrenamiento permitió confiar más en la base y evitar soluciones con arquitecturas poco soportadas o procesos de fine-tuning costosos y opacos.

"Porque Olmo es totalmente abierto, teníamos visibilidad completa de su arquitectura y sus datos de entrenamiento, permitiéndonos un nivel de confianza mayor..."

En la práctica, AISquared adaptó Bolt Instruct para producir salidas estructuradas, reducir las alucinaciones en RAG, detectar PII y ataques de jailbreak, y enrutar peticiones hacia el modelo más eficiente dentro de su plataforma UNIFI. El resultado: reducción de costos de infraestructura cercana al 50% para AISquared, con clientes viendo reducciones similares.

Cómo Domyn usó `Dolma` y `Dolci` para trazabilidad y mejor razonamiento

Domyn lanzó Domyn Small (10B parámetros) apoyándose en los datasets abiertos Dolma y Dolci. La clave para Domyn fue la proveniencia documentada de esos datos: saber exactamente qué ejemplos entraron en el entrenamiento permite a organizaciones reguladas trazar el modelo de punta a punta.

La estrategia técnica fue: partir de Italia 10B (modelo entrenado desde cero) y aplicar una canalización multietapa de post-training para convertirlo en un modelo de razonamiento con ventana de contexto extendida. Dolma aportó datos largos y de calidad, con procedencia pública, lo que facilitó la calibración frente a datos internos y aceleró la revisión de procuración para despliegue comercial.

Para afinar la precisión de respuestas, Domyn usó Dolci -un dataset de aproximadamente 260K pares de respuesta- que fue publicado junto a Olmo 3. En benchmarks de razonamiento como GPQA-Diamond, Dolci impulsó a Domyn Small en 10.1 puntos, la mejora individual más grande en su pipeline post-training.

Qué hace diferente a la apertura de Ai2 para clientes regulados

La exigencia en sectores como finanzas, salud o administración pública no es solo rendimiento: es auditoría, trazabilidad y licencias claras. La UE, por ejemplo, eleva esos requisitos con la AI Act, que pide resúmenes detallados de los datos de entrenamiento. En Estados Unidos, los contratos federales y las políticas internas de compliance requieren pruebas de origen y permisos de licencia.

Ai2 ofrece la pila completa: modelos con pesos abiertos, datasets con fuentes documentadas y licencias permisivas. Eso permite a laboratorios como Domyn y AISquared construir:

Trazabilidad directa desde el dato hasta la inferencia.
Workflows reproducibles para auditoría y verificación.
Ajustes y relicenciamiento para clientes que exigen soberanía y control.

La apertura upstream alimenta artefactos de cumplimiento downstream. Para clientes regulados, eso no es solo una ventaja técnica: es una condición de negocio.

Implicaciones prácticas para equipos técnicos y responsables de cumplimiento

Si trabajas en un equipo que debe justificar modelos ante auditores, ten en cuenta:

Pide datasets con documentación de fuente y procesos de limpieza. No aceptes "web crawl" sin trazabilidad.
Valora modelos que entreguen el flujo completo (pesos, código, arquitectura). Facilita debugging, auditoría y adaptaciones.
Considera el coste total: modelos abiertos bien soportados pueden reducir latencia operativa y costos de hosting, como mostró AISquared.
Usa benchmarks relevantes (por ejemplo GPQA-Diamond para razonamiento avanzado) y registra ganancias después de cada fase de post-training.

Reflexión final

No estamos ante un debate académico: la apertura práctica de Ai2 demuestra que es posible combinar capacidad técnica con exigencias regulatorias. Para organizaciones que necesitan responsabilidad, adaptación y reducción de riesgos, tener la "receta" del modelo es tan importante como tener el mejor resultado en un benchmark.

Fuente original

https://allenai.org/blog/domyn-aisquared-testimonial

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.

Por qué AISquared eligió Olmo

"Porque Olmo es totalmente abierto, teníamos visibilidad completa de su arquitectura y sus datos de entrenamiento, permitiéndonos un nivel de confianza mayor..."

Cómo Domyn usó Dolma y Dolci para trazabilidad y mejor razonamiento

Qué hace diferente a la apertura de Ai2 para clientes regulados

Ai2 ofrece la pila completa: modelos con pesos abiertos, datasets con fuentes documentadas y licencias permisivas. Eso permite a laboratorios como Domyn y AISquared construir:

Trazabilidad directa desde el dato hasta la inferencia.

Workflows reproducibles para auditoría y verificación.

Ajustes y relicenciamiento para clientes que exigen soberanía y control.

La apertura upstream alimenta artefactos de cumplimiento downstream. Para clientes regulados, eso no es solo una ventaja técnica: es una condición de negocio.

Implicaciones prácticas para equipos técnicos y responsables de cumplimiento

Si trabajas en un equipo que debe justificar modelos ante auditores, ten en cuenta:

Pide datasets con documentación de fuente y procesos de limpieza. No aceptes "web crawl" sin trazabilidad.

Valora modelos que entreguen el flujo completo (pesos, código, arquitectura). Facilita debugging, auditoría y adaptaciones.

Considera el coste total: modelos abiertos bien soportados pueden reducir latencia operativa y costos de hosting, como mostró AISquared.

Usa benchmarks relevantes (por ejemplo GPQA-Diamond para razonamiento avanzado) y registra ganancias después de cada fase de post-training.

Reflexión final

Por qué AISquared eligió Olmo

Cómo Domyn usó Dolma y Dolci para trazabilidad y mejor razonamiento

Qué hace diferente a la apertura de Ai2 para clientes regulados

Implicaciones prácticas para equipos técnicos y responsables de cumplimiento

Reflexión final

Fuente original

¡Mantente al día!

Por qué AISquared eligió Olmo

Cómo Domyn usó Dolma y Dolci para trazabilidad y mejor razonamiento

Qué hace diferente a la apertura de Ai2 para clientes regulados

Implicaciones prácticas para equipos técnicos y responsables de cumplimiento

Reflexión final

Fuente original

¡Mantente al día!

Por qué AISquared eligió `Olmo`

Cómo Domyn usó `Dolma` y `Dolci` para trazabilidad y mejor razonamiento

Por qué AISquared eligió `Olmo`

Cómo Domyn usó `Dolma` y `Dolci` para trazabilidad y mejor razonamiento