dots.ocr lleva OCR SOTA a iPhone con Core ML

En 2025 ya no es ciencia ficción ejecutar modelos de última generación en tu teléfono. ¿Te imaginas escanear documentos complejos sin enviar nada a la nube y sin pagar APIs por página? Eso es justo lo que muestra el equipo que convirtió dots.ocr para correr on device con Core ML y MLX.

Qué es dots.ocr y por qué importa

Dots.OCR es un modelo OCR competitivo de 3 mil millones de parámetros desarrollado por RedNote, pensado para tareas de reconocimiento de texto en documentos complejos. En pruebas públicas, supera a modelos grandes como Gemini 2.5 Pro en la benchmark OmniDocBench, lo que lo convierte en una opción interesante para llevar OCR SOTA al dispositivo. (huggingface.co)

Usar modelos en el propio equipo tiene beneficios claros: no expones claves API, no dependes de la conexión y eliminas costos por uso. Además, Apple ofrece aceleración dedicada en sus dispositivos con el Neural Engine, que en pruebas del artículo resulta mucho más eficiente energéticamente que CPU o GPU, algo crítico para apps móviles. ()

Qué es dots.ocr y por qué importa

Cómo lo hicieron correr en iPhone: pasos clave

Problemas reales y soluciones concretas

Rendimiento, tamaño y siguientes pasos

¿Qué significa esto para desarrolladores y empresas?

¡Mantente al día!

dots.ocr lleva OCR SOTA a iPhone con Core ML