PostgreSQL, ese sistema de base de datos que a veces suena a pieza de museo, está en el corazón de ChatGPT y la API de OpenAI. ¿Sorprendido? A mí también me llamó la atención. OpenAI logró soportar cientos de millones de usuarios con una sola primaria y casi 50 réplicas de lectura, pero no fue por casualidad: hubo optimizaciones, ingeniería rigurosa y decisiones prácticas difíciles.
Qué pasó y por qué importa
En un año la carga en PostgreSQL creció más de 10x. OpenAI necesitó sostener millones de consultas por segundo para 800 millones de usuarios. La estrategia principal: mantener una arquitectura de un solo nodo primario para escrituras y offload de lecturas a réplicas. ¿Por qué no dividir todo desde el inicio? Porque shardar PostgreSQL de aplicaciones existentes implica cambiar cientos de endpoints y puede tomar meses o años.
Pero trabajar con una sola primaria trae riesgos: ráfagas de escrituras, consultas pesadas y fallas en la cache pueden saturar la primaria y desencadenar ciclos de reintentos que empeoran todo. La historia muestra que con ingeniería y prudencia, PostgreSQL puede escalar mucho más de lo que muchos pensaban, especialmente para cargas dominadas por lecturas.
