Pediste que un agente arme un sitio con monumentos de París en 3D a partir de imágenes. No abrí un generador de imágenes. No toqué una herramienta de reconstrucción 3D. El agente llamó a dos Hugging Face Spaces y ensambló todo: imágenes, reconstrucciones en splats gaussianos, compresión, visor y despliegue estático. ¿Suena mágico? Es ingeniería por bloques, y ya está aquí.
Qué hace agents.md y por qué importa
Hasta ahora, el problema no era tanto entrenar un buen modelo de imagen, video, TTS o 3D. El problema real era integrar: SDKs, pesos, GPUs, formatos de entrada, polling. Si cada modelo fuera un bloque documentado y fácilmente invocable, un agente podría pegarlos como si fueran paquetes npm.
Eso es exactamente lo que agents.md entrega en un Space Gradio: la receta mínima para que un agente invoque ese servicio. Un curl https://huggingface.co/spaces/VAST-AI/TripoSplat/agents.md devuelve en una sola pasada lo necesario: la URL del esquema, plantillas de llamada y poll, cómo subir archivos y la pista de autenticación. Con eso, un agente puede usar el Space de punta a punta.
