El gobierno de Estados Unidos le apagó a Claude su modelo más potente tres días después de lanzarlo.
El viernes, a las 17:21, le llegó a Anthropic una orden de control de exportación: tenían que cortar el acceso a Fable 5 y a Mythos 5 para todos sus usuarios extranjeros, de un día para el otro, ¡incluyendo a los mismos empleados de Anthropic!
El gobierno dice que encontró la forma de romperle la seguridad al modelo, algo que se conoce como "jailbreak".
El problema de fondo es que estos sistemas, por más miles de millones que les metas encima, no son infalibles. El caso más increíble lo mostraron unos investigadores que agarraron mil doscientos pedidos prohibidos y, en vez de pedírselos derecho, los reescribieron en forma de poema, con rimas y metáforas. La tasa de éxito para vulnerarlo se multiplicó por cinco y en algunos modelos pasó del noventa por ciento. Justicia poética, literalmente.
Con algo que se rompe tan fácil y que es capaz de vulnerar sistemas de seguridad cada vez más complejos, una regulación de implementación gradual tiene todo el sentido y Anthropic la venía pidiendo desde hace rato.
Pero, a su vez, nos da una idea del mundo que se nos viene: uno en el que los mejores modelos se le dan de manera discrecional a los que el gobierno y las empresas de IA prefieren. Es un dilema que no tiene una salida fácil.
¿Qué hacemos? ¿Los soltamos a todos por igual en nombre de la libertad y arriesgamos la seguridad de los que tarden en implementarlo? ¿O los regulamos en nombre de la seguridad y le damos una ventaja competitiva a las empresas amigas que los tengan antes?