MedQA: afina IA clínica en AMD ROCm sin CUDA

MedQA demuestra que puedes entrenar y desplegar una IA clínica capaz de responder preguntas de examen con explicaciones clínicas, usando solamente hardware AMD y ROCm. ¿La sorpresa? No necesitas CUDA ni trucos mágicos de cuantización cuando tienes una GPU como la MI300X.

Qué es MedQA y por qué importa

MedQA es un adaptador LoRA finamente ajustado sobre Qwen3-1.7B para responder preguntas médicas de elección múltiple y además justificar la respuesta con razonamiento clínico. El objetivo no es reemplazar un diagnóstico médico, sino ofrecer respuestas con explicación que sean más útiles y verificables que una letra sin contexto.

Aquí hay tres razones clave por las que esto importa para equipos técnicos y clínicos:

La salida incluye tanto la letra correcta como una explicación clínica, lo que ayuda a auditoría y verificación.
Se entrenó y exportó el adaptador completo en hardware AMD usando ROCm, con cero dependencias CUDA.
El uso de LoRA mantiene el ajuste eficiente: solo ~2.2 millones de parámetros entrenables frente a 1.5B del modelo base.

Problema	Causa	Solución
NaN loss	Inestabilidad en precisión mixta	Cambiar de bfloat16 a fp16
GPU no detectada	Variables ROCm faltantes	Setear `ROCR_VISIBLE_DEVICES`, `HIP_VISIBLE_DEVICES`, `HSA_OVERRIDE_GFX_VERSION`
bitsandbytes no funciona	No hay build ROCm	Evitar cuantización, usar memoria MI300X
Salida basura en inferencia	Padding mal configurado	`pad_token = eos_token` y corregir `padding_side`
Errores en Trainer	Versiones de Transformers desalineadas	Pinear `transformers>=4.40.0`

Qué es MedQA y por qué importa

Hardware: por qué la AMD Instinct MI300X cambia el juego

Pipeline técnico: modelo base, LoRA y parámetros de entrenamiento

Inference y despliegue

Resultados, métricas y lecciones aprendidas

Qué sigue: escalado y robustez

Reflexión final

Fuente original

¡Mantente al día!

MedQA: afina IA clínica en AMD ROCm sin CUDA