Safetensors se une a la PyTorch Foundation

hace 5 horas3 minutos

Safetensors nació en Hugging Face para resolver un problema concreto: compartir pesos de modelos sin riesgo de ejecutar código arbitrario. En vez de depender de formatos basados en pickle, que podían esconder código malicioso, se diseñó una alternativa simple y segura que hoy domina la distribución de modelos en la comunidad abierta.

Qué es `safetensors` y por qué importa

El formato es intencionalmente sencillo: un encabezado JSON (con un límite de 100MB) que describe la metadata de los tensores, seguido por los datos crudos de los tensores. Esto permite varias ventajas técnicas clave:

Zero-copy loading: los tensores se pueden mapear directamente desde disco sin copiar datos innecesarios a memoria. Piensa en mmap aplicado a pesos de modelos.
Lazy loading: puedes leer pesos individuales sin deserializar un checkpoint entero, útil para transfer learning o carga selectiva en clusters.
Seguridad: al no ejecutar código al deserializar, se elimina la principal vía de ataque que tenía pickle.

Estas características explican por qué safetensors se convirtió en el formato por defecto en el Hub de Hugging Face y en muchos otros proyectos: es rápido, seguro y simple.

La mudanza a la PyTorch Foundation: qué cambia

Lo esencial: safetensors pasa a tener un hogar neutral bajo la PyTorch Foundation, parte del Linux Foundation. ¿Qué significa eso en la práctica?

Gobernanza neutral: la marca, el repositorio y la gobernanza están ahora en una estructura vendor-neutral, no controlada por una sola empresa.
Mantenedores principales: Luc y Daniel, los mantenedores clave de Hugging Face, permanecen en el Technical Steering Committee y seguirán liderando el trabajo diario.
Transparencia para contribuyentes: el camino para convertirse en mantenedor está documentado en GOVERNANCE.md y MAINTAINERS.md.

Para la mayoría de los usuarios nada cambia: el formato y las APIs siguen iguales, y los modelos ya almacenados en safetensors continuarán funcionando sin cambios.

Roadmap técnico y prioridades

Estar dentro de la PyTorch Foundation abre colaboración directa con proyectos que necesitan resolver los mismos retos. Entre los objetivos técnicos anunciados están:

Carga y guardado conscientes del dispositivo: permitir que tensores se carguen directamente en CUDA, ROCm y otros aceleradores sin etapas innecesarias en CPU.
APIs primero para Tensor Parallel y Pipeline Parallel: que cada rank o etapa cargue solo los pesos que necesita, reduciendo I/O y memoria.
Soporte formal para nuevas opciones de cuantización: FP8, formatos block-quantizados como GPTQ y AWQ, y tipos enteros sub-byte.
Evaluar integración como sistema de serialización para modelos torch en el core de PyTorch.

Estos son problemas donde la colaboración comunitaria acelera soluciones robustas y compatibles con múltiples frameworks y hardware.

¿Y si quieres contribuir o integrar `safetensors`?

Si eres desarrollador, investigador u organización y dependes de safetensors, ahora tienes rutas claras para participar:

Reporta bugs o abre discusiones en el repositorio.
Propón mejoras de API o nuevas funcionalidades técnicas.
Participa en la gobernanza siguiendo GOVERNANCE.md.

Links útiles para empezar:

GitHub: https://github.com/huggingface/safetensors
Documentación: https://huggingface.co/docs/safetensors
PyTorch Foundation: https://pytorch.org/foundation

Reflexión final

Mover safetensors a la PyTorch Foundation no es solo un cambio administrativo: es una apuesta por la sostenibilidad, la neutralidad y la colaboración abierta. ¿Por qué importa esto? Porque cuando un formato crítico para modelos es administrado por la comunidad, las decisiones técnicas tienden a priorizar interoperabilidad, seguridad y futuro soporte en hardware diverso. Si trabajas con modelos a escala, esto puede traducirse en menos fricción y más opciones a la hora de desplegar y optimizar pesos.

Fuente original

https://huggingface.co/blog/safetensors-joins-pytorch-foundation

¡Mantente al día!

Recibe noticias de IA, lanzamientos de herramientas y productos innovadores directo en tu correo. Todo claro y útil.

Qué es safetensors y por qué importa

Zero-copy loading: los tensores se pueden mapear directamente desde disco sin copiar datos innecesarios a memoria. Piensa en mmap aplicado a pesos de modelos.

Lazy loading: puedes leer pesos individuales sin deserializar un checkpoint entero, útil para transfer learning o carga selectiva en clusters.

Seguridad: al no ejecutar código al deserializar, se elimina la principal vía de ataque que tenía pickle.

Estas características explican por qué safetensors se convirtió en el formato por defecto en el Hub de Hugging Face y en muchos otros proyectos: es rápido, seguro y simple.

La mudanza a la PyTorch Foundation: qué cambia

Lo esencial: safetensors pasa a tener un hogar neutral bajo la PyTorch Foundation, parte del Linux Foundation. ¿Qué significa eso en la práctica?

Gobernanza neutral: la marca, el repositorio y la gobernanza están ahora en una estructura vendor-neutral, no controlada por una sola empresa.

Mantenedores principales: Luc y Daniel, los mantenedores clave de Hugging Face, permanecen en el Technical Steering Committee y seguirán liderando el trabajo diario.

Transparencia para contribuyentes: el camino para convertirse en mantenedor está documentado en GOVERNANCE.md y MAINTAINERS.md.

Para la mayoría de los usuarios nada cambia: el formato y las APIs siguen iguales, y los modelos ya almacenados en safetensors continuarán funcionando sin cambios.

Roadmap técnico y prioridades

Estar dentro de la PyTorch Foundation abre colaboración directa con proyectos que necesitan resolver los mismos retos. Entre los objetivos técnicos anunciados están:

Carga y guardado conscientes del dispositivo: permitir que tensores se carguen directamente en CUDA, ROCm y otros aceleradores sin etapas innecesarias en CPU.

APIs primero para Tensor Parallel y Pipeline Parallel: que cada rank o etapa cargue solo los pesos que necesita, reduciendo I/O y memoria.

Soporte formal para nuevas opciones de cuantización: FP8, formatos block-quantizados como GPTQ y AWQ, y tipos enteros sub-byte.

Evaluar integración como sistema de serialización para modelos torch en el core de PyTorch.

Estos son problemas donde la colaboración comunitaria acelera soluciones robustas y compatibles con múltiples frameworks y hardware.

¿Y si quieres contribuir o integrar safetensors?

Si eres desarrollador, investigador u organización y dependes de safetensors, ahora tienes rutas claras para participar:

Reporta bugs o abre discusiones en el repositorio.

Propón mejoras de API o nuevas funcionalidades técnicas.

Participa en la gobernanza siguiendo GOVERNANCE.md.

Links útiles para empezar:

Reflexión final

Qué es safetensors y por qué importa

La mudanza a la PyTorch Foundation: qué cambia

Roadmap técnico y prioridades

¿Y si quieres contribuir o integrar safetensors?

Reflexión final

Fuente original

¡Mantente al día!

Qué es safetensors y por qué importa

La mudanza a la PyTorch Foundation: qué cambia

Roadmap técnico y prioridades

¿Y si quieres contribuir o integrar safetensors?

Reflexión final

Fuente original

¡Mantente al día!

Qué es `safetensors` y por qué importa

¿Y si quieres contribuir o integrar `safetensors`?

Qué es `safetensors` y por qué importa

¿Y si quieres contribuir o integrar `safetensors`?