DR Tulu lanza receta abierta para investigación profunda

DR Tulu es una apuesta abierta para que los modelos hagan investigación profunda: planificar, buscar y sintetizar información de muchas fuentes para producir respuestas largas, justificadas y con citas claras. ¿Suena complejo? Sí. ¿Es útil hoy? También.

Qué es DR Tulu y por qué importa

DR Tulu es el primer modelo abierto entrenado específicamente para tareas de investigación larga mediante una receta end-to-end que combina SFT (supervised fine-tuning) y una nueva variante de RL que llaman RLER (Reinforcement Learning with Evolving Rubrics). La idea principal es entrenar agentes que no solo contesten, sino que investiguen: planeen, llamen herramientas de búsqueda, junten evidencias y documenten cada afirmación con citas verificables.

¿Por qué es relevante ahora? Porque muchos agentes de investigación potentes son propietarios. DR Tulu propone una alternativa reproducible: modelo, código, librería de agente y la receta completa bajo licencia permisiva.

Qué es DR Tulu y por qué importa

Cómo trabaja: agente, herramientas y MCP

La receta de entrenamiento: SFT + RLER

SFT para arranque en frío

RLER: recompensas que evolucionan

Resultados en benchmarks y eficiencia

Caso clínico: genética y límites actuales

Diseño práctico: reproducibilidad y uso

Reflexión final

Fuente original

¡Mantente al día!

DR Tulu lanza receta abierta para investigación profunda