Agente de datos que piensa como científico en DABStep

NVIDIA KGMON (NeMo Agent Toolkit) Data Explorer alcanzó el primer puesto en el benchmark DABStep usando una estrategia que separa aprendizaje pesado de inferencia rápida. ¿La clave? Construir herramientas reutilizables durante una fase de aprendizaje y luego ejecutar respuestas con un agente pequeño y ágil que orquesta esas herramientas.

Qué problema resuelve

Los agentes que dependen de búsqueda en texto fallan cuando la información está en tablas y requiere razonamiento en varios pasos. Preguntas complejas sobre datos tabulares no se arreglan con un snippet de web. ¿Te ha pasado que un modelo responde bien a una cosa, pero se pierde al cruzar dos archivos CSV y reglas de dominio? Este proyecto se diseñó para eso: preguntas multi-paso, herramientas stateful y validación estricta.

Arquitectura en tres fases

La idea central es dividir responsabilidades: gastar cómputo una vez para producir herramientas robustas, y luego usar esas herramientas muchas veces de forma eficiente.

Sistema	Easy	Hard	Time/Task	Code Length
NVIDIA KGMON (NeMo Agent Toolkit) Data Explorer + haiku 4.5	87.5	89.95	20s	1870
claude code + opus 4.5	90.2	66.93	10min	5011
DataPilot from AntGroup	86.11	87.57	unknown	unknown
DS-STAR from Google AI	87.5	45.24	unknown	unknown

Qué problema resuelve

Arquitectura en tres fases

Dos loops de agente según caso de uso

Insight técnico: por qué funciona

Resultados y comparativa

Cómo replicarlo o aplicarlo en tus proyectos (guía técnica breve)

Impacto y limitaciones

Fuente original

¡Mantente al día!

Agente de datos que piensa como científico en DABStep