AMD acaba de dar un golpe fuerte en la IA local.
Lisa Su subiรณ al escenario con un mini PC del tamaรฑo de un libro grueso en una sola mano y ejecutรณ en vivo un modelo de 235 mil millones de parรกmetros. Sin datacenter. Sin cloud. Sin alquilar GPUs.
El protagonista es el Ryzen AI Max 395 (Strix Halo). Es el primer chip x86 que une CPU y GPU con 128 GB de memoria unificada. En Linux, el GPU puede usar hasta ~110 GB de esa memoria.
Para ponerlo en contexto: una RTX 5090 tiene 32 GB y una 4090 tiene 24 GB. Este pequeรฑo equipo ofrece mรกs del triple de memoria accesible para modelos grandes, en un chasis compacto.
En pruebas especรญficas de inferencia (como DeepSeek R1), superรณ en mรกs de 3x al rendimiento de una RTX 5080 cuando el modelo no cabe en la VRAM de la tarjeta de Nvidia.
El precio real del equipo con 128 GB (GMKtec EVO-X2) suele estar entre $1,800 y $2,500 segรบn ofertas (el kit oficial de AMD es mรกs caro).
Para quien usa mucho IA, esto cambia las cuentas: en vez de pagar cientos de dรณlares al mes en suscripciones (Claude, ChatGPT Pro, Cursor, etc.), puedes correr modelos potentes localmente con Ollama, LM Studio o similares. Privacidad total, sin lรญmites de tokens y sin que te corten el servicio a las 3 a.m.
No es que las suscripciones vayan a desaparecer maรฑana, pero para muchos casos de uso (RAG con documentos privados, prototipos, agentes locales, etc.) esta opciรณn se vuelve muy atractiva.
Estamos viendo el inicio de una nueva etapa de IA local accesible y potente??