Hugging Face lanza Storage Buckets para artefactos ML

Imagina un lugar en el Hub donde dejas todo lo que está "en movimiento": checkpoints, shards procesados, logs y trazas. Storage Buckets llega para cubrir justo eso: un almacenamiento mutable, tipo S3, pensado para los artefactos efímeros y de alto rendimiento que genera ML en producción.

Qué son los Storage Buckets y por qué importan

Un Bucket es un contenedor no versionado dentro del Hub. Vive bajo tu usuario u organización, respeta los permisos de Hugging Face, puede ser privado o público, tiene una página web y una dirección programática como hf://buckets/usuario/mi-bucket.

¿Por qué no usar Git para esto? ¿Has visto cuánto ruido genera un entrenamiento que escribe checkpoints cada few minutos? Git no fue diseñado para objetos mutables y de gran tamaño que cambian constantemente. Buckets están diseñados para escribir rápido, sobrescribir cuando sea necesario, sincronizar directorios y eliminar archivos obsoletos sin complicaciones.

Qué son los Storage Buckets y por qué importan

La ventaja técnica: Xet y deduplicación por chunks

Rendimiento global y pre-warming por región

Cómo empezar rápido con la CLI

Integración programática: Python, JavaScript y fsspec

Buen patrón de uso: capa mutable vs capa versionada

Experiencias y adopción temprana

Fuente original

¡Mantente al día!

Hugging Face lanza Storage Buckets para artefactos ML