Claude impulsa computación científica con agentes largos

Hace unos años la idea de dejar que un agente de IA trabaje días por cuenta propia sonaba a ciencia ficción. Hoy puedes especificar un objetivo claro, darle contexto, un conjunto de reglas y ver cómo un equipo de agentes realiza trabajo numérico complejo mientras tú supervisas ocasionalmente. ¿Suena a magia? Es gestión de proyecto potenciada por modelos capaces de tareas de largo alcance.

Qué es un flujo de trabajo "long-running" para ciencia

Anthropic describe cómo pasar de un bucle conversacional corto a un flujo donde un agente opera autónomamente durante días: planificación inicial, memoria persistente, oráculos de prueba y patrones de orquestación. Esto permite comprimir meses de trabajo humano en días para tareas bien acotadas: reescribir código legacy, reimplementar un solver numérico, o depurar una base de código grande contra una referencia.

En el ejemplo técnico, se usa Claude Opus 4.6 con Claude Code para implementar una versión diferenciable de un solver de Boltzmann cosmológico. Ese solver evoluciona ecuaciones acopladas para fotones, bariones, neutrinos y materia oscura, y su salida se usa para comparar con datos como los de Planck. Hacerlo diferenciable en JAX abre la puerta a inferencia basada en gradientes, acelerando mucho la estimación de parámetros.

Qué es un flujo de trabajo "long-running" para ciencia

Por qué tiene sentido este enfoque

Componentes prácticos del flujo de trabajo

1) CLAUDE.md: la especificación viva

2) CHANGELOG.md: memoria de largo plazo

3) Test oracle: la brújula del proyecto

4) Git como coordinación ligera

5) Orquestación en HPC con SLURM y tmux

Patrones de orquestación útiles: el Ralph loop y variantes

Resultados y limitaciones observadas

Implicaciones prácticas y éticas

Fuente original

¡Mantente al día!

Claude impulsa computación científica con agentes largos