Granite R2: 32K multilingual embeddings and high performance

IBM releases two multilingual embedding models under Apache 2.0 that tackle a very real question: how do you get good language coverage without a giant model? Granite R2’s answer is pragmatic: a full 311M-parameter model with Matryoshka support and a compact 97M that leads the sub-100M category in multilingual retrieval.

Both handle long context up to 32,768 tokens, cover 200+ languages, and add code retrieval for 9 languages.

Qué trae Granite Embedding Multilingual R2

Modelos publicados:
- granite-embedding-311m-multilingual-r2: 311M parameters, 768-d embeddings, Matryoshka (truncatable to 512/384/256/128).
- granite-embedding-97m-multilingual-r2: 97M parameters, 384-d embeddings, optimized for throughput and edge.
Cobertura: 200+ languages; 52 languages with explicit training for retrieval. Code support: Python, Go, Java, JavaScript, PHP, Ruby, SQL, C, C++.

Qué trae Granite Embedding Multilingual R2

Por qué importa para producción

Arquitectura y qué cambió desde R1

Cómo se entrenaron (resumen técnico)

Benchmarks y números que importan

Matryoshka Embeddings: flexibilidad práctica

Integración con frameworks y despliegue

¿Cuál deberías elegir?

Consejos prácticos antes de migrar

Fuente original

Stay up to date!

Granite R2: 32K multilingual embeddings and high performance