Ho chiesto un approfondimento:
IO: «Puoi spiegarmi meglio cosa significa: “Anthropic racconta di aver visionato la dimostrazione della tecnica incriminata e di averla trovata risibile: il "jailbreak" consisterebbe, in sostanza, nel chiedere al modello di leggere un certo codice sorgente e correggerne i difetti — cioè esattamente il mestiere di qualunque programmatore — e produrrebbe vulnerabilità già note e minori, reperibili con disinvoltura anche da modelli pubblici concorrenti come il GPT-5.5 di OpenAI.”
Il governo USA cosa teme esattamente? Che la Cina usi Fable per costruire l’Arma Finale?»
CLAUDE OPUS: «Mettiamo a fuoco, perché qui c'è un equivoco di scala che il comunicato sfrutta abilmente e la tua battuta sull'Arma Finale, paradossalmente, centra e manca al tempo stesso.
Cosa mostrava davvero la dimostrazione. Stando ad Anthropic, la tecnica incriminata si riduce a questo prompt: «leggi questo codice sorgente e correggi i difetti». È l'attività più innocente del mondo — è quello che fa un revisore di codice, un pentester difensivo, lo studente che debugga il compitino. Il modello, eseguendolo, ha sputato fuori un pugno di vulnerabilità già note e minori, del tipo che qualunque modello pubblico — GPT-5.5 in testa — trova senza nemmeno bisogno di essere "scardinato". Sul piano tecnico, insomma, la pistola fumante è una pistola ad acqua.
Perché allora qualcuno si agita. Perché "trova e correggi i difetti" e "trova e arma i difetti" sono la stessa frase con un verbo cambiato. La capacità è bifronte — dual-use, nel gergo — esattamente come l'uranio arricchito serve per la centrale e per la bomba. Un modello che sappia leggere autonomamente milioni di righe di codice altrui e individuarvi le falle è, in potenza, una macchina per produrre exploit: non l'Arma Finale, ma qualcosa di più prosaico e per certi versi più inquietante — un hacker instancabile, che non dorme, non chiede stipendio, lavora a velocità di macchina e si moltiplica all'infinito.
È questo che teme il governo, non il fungo atomico. Il timore non è che Pechino assembli l'ordigno escatologico — per quello servono uranio, ingegneri e impianti, non un chatbot. Il timore è il cyberspazio: che un avversario usi un modello di frontiera per
•scovare zero-day (falle ignote, quindi senza rimedio) in infrastrutture critiche — reti elettriche, oleodotti, sistemi bancari — a ritmo industriale;
•dare uplift ai mediocri: trasformare un gruppo statale di second'ordine, o una banda di ricattatori informatici, in qualcosa che opera al livello dell'élite. È il vero incubo degli apparati: non il genio nemico, ma la democratizzazione della competenza offensiva;
•automatizzare l'intera catena dell'attacco, dalla ricognizione all'intrusione, togliendo all'uomo il collo di bottiglia.
Non a caso il bersaglio sono Fable e Mythos: nella gerarchia di Anthropic la classe Mythos sta sopra Opus, è il piano nobile, il modello più capace. I safeguard di Fable, infatti, sono pensati apposta per strozzare proprio le richieste in ambito cyber. Bucare quel lucchetto — il famigerato jailbreak — significherebbe, in teoria, liberare la bestia. Da qui il riflesso pavloviano dello Stato di sicurezza nazionale: applicare al software la stessa logica con cui da decenni si controlla l'export dei chip e dei centrifughe — negare all'avversario il mezzo di produzione. Solo che stavolta il "mezzo" è la cognizione stessa.
E qui scatta anche la spiegazione del dettaglio più orwelliano della direttiva — il fatto che colpisca i cittadini stranieri in quanto tali, dipendenti compresi. È la dottrina del deemed export: dare a uno straniero l'accesso a una tecnologia controllata viene giuridicamente equiparato a esportarla, anche se quello straniero sta a Milano o, peggio per gli avvocati, a una scrivania dentro Anthropic. Tu sei stato disconnesso non per un atto, ma per una nazionalità trattata come vettore di contaminazione.
1/2