Cuando el crash desaparece: control en 5 modelos

8 jun 2026Keryc Díaz5 minutos

Conté una historia que me gustó: una leyenda del bosque llamada "Run on Oona's Hoard" que reescribía una corrida bancaria de 1929 como folklore. Un búho que guarda miel leyó el pánico, empezó a liquidar y el precio de la miel se desplomó de 10 a 3 en unos turnos. Nadie lo programó directamente. La tesis era simple: dale a un modelo pequeño un rol y un presupuesto, y el comportamiento de mercado emergente aparece solo.

El experimento y la reconstrucción

Reconstruí el bosque con una modificación clave. En lugar de un solo modelo controlando cinco criaturas, puse un consejo formado por cinco modelos distintos: un modelo de OpenAI, uno de NVIDIA, uno de OpenBMB y dos copias de un modelo de medio billón de parámetros que afiné yo mismo. La idea fue honestidad: si vas a decir que los modelos pequeños pueden sostener una economía viva, que sean cinco arquitecturas distintas tomando decisiones distintas, no un solo modelo con cinco sombreros.

También rehice al operador. En la versión nueva el jugador es un financiero en las sombras: toma una posición corta, susurra un tip verdadero para preparar la caída, activa la leyenda y cobra cuando el precio se hunde. Hice visible el loop en pantalla: objetivo, marcador y una primera orden con un clic. Hacer la promesa visible es la forma más rápida de descubrir que la promesa es falsa.

Cuando intenté la jugada —short a la miel y activar la Run on Oona's Hoard— la miel no se desplomó. Subió. Los modelos del consejo, leyendo el rumor de que la bóveda estaba vacía y una señal de cosecha mala, no vendieron: atesoraron. Escasez, no pánico. El short perdió dinero y la narrativa que había escrito sin ironía fue que la apuesta se había echado a perder.

Por qué falló la emergencia

La lección técnica es clara: en una economía de agentes, el precio de referencia no es un dial que giras desde fuera. Es el residuo de lo que los agentes realmente eligen intercambiar. El crash original era real, pero dependía de la disposición de un único modelo, no era una propiedad robusta del sistema. Cambia la población y el comportamiento emergente puede evaporarse.

Probé tres maneras de forzar la caída, todas fallaron en vivo:

Dejé la leyenda como rumor puro y confié en que los agentes reaccionaran. No vendieron.
Regué cada criatura con un windfall de miel, pensando que el glut colapsaría demanda. Funcionó con mi test policy mecánica (un stand-in rápido) porque esa política obedece umbrales rígidos de deseo, pero los modelos reales ignoraron la inundación y actuaron según su lectura.
Agrandé la posición corta, lo que solo aumentó la pérdida.

Tres corridas en vivo, tres pérdidas: -15, -26 y -27 guijarros. Cada palanca que movía era solo una entrada para las decisiones de los agentes, y los agentes eran libres de rechazarlas. No puedes dirigir una población heterogénea con un choque mecánico: el choque solo sesga una elección que aún es suya.

Además hay una trampa editorial que conviene nombrar: el stand-in barato que te permite iterar rápido también es el que más probablemente te halague una solución equivocada. Cuando la política de prueba y los agentes reales discrepan, el que miente es el stand-in.

Intento	Mecanismo	Miel al settlement	P&L del gambito
Original, un modelo	ese modelo eligió vender	10 a 3	victoria de showcase
Consejo, solo rumor	cinco modelos eligieron atesorar	subió por escasez	-15
Consejo, glut de inventario	colapso de demanda, solo `test policy`	casi sin cambio	-26 a -27
Consejo, override en settlement	precio reducido a la mitad por fiat	se desploma post-limpieza	+40

Table 1. La misma jugada en cuatro mundos. El crash fue emergente y frágil bajo un modelo, ausente con un consejo heterogéneo y confiable solo cuando lo autoricé en el settlement.

La solución: autoría en el `settlement seam`

Dejé de intentar convencer a los agentes y pasé a hacer la corrida verdadera por construcción. Una corrida bancaria es, por definición, un crash. Así que la leyenda ahora aplica la caída en settlement: después de que el mercado termina de limpiar cada turno, sobrescribo el precio de referencia y la mercancía se devalúa a la mitad. Los agentes pueden comerciar y rumorear todo lo quieran; luego la corrida cae como un hecho y el short que la adelantó cobra su ganancia.

Eso suena a rendirse ante la emergencia, pero no lo es. La capa emergente —los cinco modelos negociando, chismeando, atesorando, formando rencores— sigue haciendo que el bosque se sienta vivo. Lo que aprendí es práctico: no obtienes resultados fiables empujando más las entradas de la emergencia. Obtienes resultados fiables eligiendo con precisión la costura donde impones un override determinista, y dejando todo upstream libre. Emergencia para la textura, autoría para los momentos que deben ocurrir. El oficio consiste en saber cuál es cuál y dónde está la costura.

Implicaciones técnicas y recomendaciones

Heterogeneidad importa: validar un comportamiento emergente con un solo agente es anecdótico. Prueba poblaciones distintas y arquitecturas variadas antes de declarar una propiedad del sistema.
No confíes ciegamente en stand-ins: una test policy que obedece reglas rígidas te dará velocidad, pero también falsos positivos. Si la réplica solo ocurre con el stand-in, el hallazgo no es fiable.
Autoría en el settlement: si necesitas resultados deterministas (liquidaciones, pérdidas sistemáticas, efectos regulatorios), implementa el cambio downstream de forma explícita. Eso preserva la riqueza emergente aguas arriba y garantiza que las condiciones críticas se cumplan.
Control vs. textura: piensa en la arquitectura del juego/mercado en capas. Usa agentes para textura y robustez experiencial. Usa seams deterministas para invariantes del sistema que deben sostenerse bajo cualquier combinación de agentes.

Reflexión final

La moraleja no es tecnofobia ni un rechazo de la emergencia. Es humildad metodológica. Emergence es fascinante y útil, pero contingente. Si tratas una corrida emergente en un demo como una ley científica, te expones a sorpresas amargas cuando cambie la población de agentes o cuando pases del stand-in a modelos en vivo.

He cometido estas mismas equivocaciones a mayor escala y con apuestas más altas. Fue productivo equivocarme otra vez en un bosque donde lo único en riesgo eran unos cuantos guijarros y una historia que había contado con exceso de confianza. Pequeños modelos, grandes aventuras, y a veces un crash que tienes que autorizar tú mismo para que el cuento termine como quieres.

Fuente original

https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim-v3

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.

Cuando el crash desaparece: control en 5 modelos

8 jun 2026Keryc Díaz5 minutos

El experimento y la reconstrucción

Por qué falló la emergencia

Probé tres maneras de forzar la caída, todas fallaron en vivo:

Dejé la leyenda como rumor puro y confié en que los agentes reaccionaran. No vendieron.
Regué cada criatura con un windfall de miel, pensando que el glut colapsaría demanda. Funcionó con mi test policy mecánica (un stand-in rápido) porque esa política obedece umbrales rígidos de deseo, pero los modelos reales ignoraron la inundación y actuaron según su lectura.
Agrandé la posición corta, lo que solo aumentó la pérdida.

Intento	Mecanismo	Miel al settlement	P&L del gambito
Original, un modelo	ese modelo eligió vender	10 a 3	victoria de showcase
Consejo, solo rumor	cinco modelos eligieron atesorar	subió por escasez	-15
Consejo, glut de inventario	colapso de demanda, solo `test policy`	casi sin cambio	-26 a -27
Consejo, override en settlement	precio reducido a la mitad por fiat	se desploma post-limpieza	+40

Table 1. La misma jugada en cuatro mundos. El crash fue emergente y frágil bajo un modelo, ausente con un consejo heterogéneo y confiable solo cuando lo autoricé en el settlement.

La solución: autoría en el `settlement seam`

Implicaciones técnicas y recomendaciones

Heterogeneidad importa: validar un comportamiento emergente con un solo agente es anecdótico. Prueba poblaciones distintas y arquitecturas variadas antes de declarar una propiedad del sistema.
No confíes ciegamente en stand-ins: una test policy que obedece reglas rígidas te dará velocidad, pero también falsos positivos. Si la réplica solo ocurre con el stand-in, el hallazgo no es fiable.
Autoría en el settlement: si necesitas resultados deterministas (liquidaciones, pérdidas sistemáticas, efectos regulatorios), implementa el cambio downstream de forma explícita. Eso preserva la riqueza emergente aguas arriba y garantiza que las condiciones críticas se cumplan.
Control vs. textura: piensa en la arquitectura del juego/mercado en capas. Usa agentes para textura y robustez experiencial. Usa seams deterministas para invariantes del sistema que deben sostenerse bajo cualquier combinación de agentes.

Reflexión final

Fuente original

https://huggingface.co/blog/build-small-hackathon/thousand-token-wood-sim-v3

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.

El experimento y la reconstrucción

Por qué falló la emergencia

La solución: autoría en el settlement seam

Implicaciones técnicas y recomendaciones

Reflexión final

Fuente original

¡Mantente al día!

El experimento y la reconstrucción

Por qué falló la emergencia

La solución: autoría en el settlement seam

Implicaciones técnicas y recomendaciones

Reflexión final

Fuente original

¡Mantente al día!

La solución: autoría en el `settlement seam`

La solución: autoría en el `settlement seam`