Granite 4.0 1B Speech: ASR multilingüe compacto para edge

IBM presenta Granite 4.0 1B Speech, un modelo de voz compacto pensado para aplicaciones empresariales en dispositivos con recursos limitados. ¿Qué significa esto en la práctica? Menos parámetros, mejor precisión en inglés, inferencia más rápida y soporte ampliado a varios idiomas, incluyendo ahora japonés y biasing por listas de palabras para nombres y acrónimos.

Qué es Granite 4.0 1B Speech

Granite 4.0 1B Speech es la versión reducida y optimizada de la familia Granite Speech de IBM. Tiene aproximadamente la mitad de parámetros que su predecesor granite-speech-3.3-2b, pero logra mejores resultados de transcripción en inglés. Está diseñado para dos tareas principales:

ASR (automatic speech recognition) multilingüe.
AST (bidirectional automatic speech translation).

Soporta inglés, francés, alemán, español, portugués y japonés. Dos novedades destacadas: soporte de ASR en japonés y biasing por listas de palabras (útil para nombres, marcas y siglas), funcionalidades muy pedidas por la comunidad.

Qué es Granite 4.0 1B Speech

Rendimiento y métricas

Arquitectura y soporte técnico

Cómo acelera la inferencia

Despliegue en edge y recomendaciones prácticas

Casos de uso concretos

Consideraciones finales

Fuente original

¡Mantente al día!

Granite 4.0 1B Speech: ASR multilingüe compacto para edge