Bon, j’ai lu beaucoup trop de bêtises sur Mistral, la crise IA géopolitique et les enjeux cruciaux du moment.
Il faut rétablir des vérités ignorées par 99 % des commentateurs.
Le moment Fable 5 est important pour 3 raisons :
1.Celle que tout le monde a captée : ça montre que sans IA de frontière sur laquelle elles ont la main, les nations sont à poil. Et que les États-Unis n’en ont rien à faire de l’Europe. L’Occident est un mythe géopolitique. In fine c’est America First. Si rien n’est fait, l’histoire du monde ce sera USA vs Chine et le reste en spectateur au mieux, vassal au pire.
2.Celle que les gens captent moins : nous sommes arrivés à un niveau où les IA les plus avancées peuvent trouver des failles de cybersécurité inconnues. Elles sont donc d’ores et déjà des armes géopolitiques qui déterminent qui est puissant et qui est à poil. On ne parle pas d’un futur hypothétique avec des terminators autonomes, on parle d’un présent où nos concurrents géopolitiques peuvent trouver des accès à tous nos systèmes informatiques, et donc potentiellement à tous nos secrets, et désactiver toutes nos défenses.
3.Nous sommes potentiellement à l’aube de l’auto-récursivité, c’est-à-dire le moment où l’IA permet de créer le modèle d’IA suivant et ainsi de suite. Conséquence : un écart technologique de quelques mois se met à représenter des années voire des décennies en termes de puissance et de capacités. La qualité exceptionnelle des derniers modèles d’Anthropic laisse penser que la phase d’accélération a peut-être déjà commencé.
Pourquoi nous ne sommes pas foutus :
1.Les non-spécialistes ignorent sans doute qu’est sorti hier un modèle open weight chinois, GLM-5.2, qui semble être du niveau de Fable. Or si Anthropic fait grosso modo 40 fois la taille de Mistral, ce qui est super décourageant sur le papier, GLM ne fait que deux fois la taille de Mistral.
2.GLM-5 est probablement le fruit de 70 MW de compute, là où Mistral est à 44 MW, mais en progression rapide. Les deux sociétés ont le même ordre de grandeur de techos de très haut niveau. Dans les centaines.
3.Nous ne sommes donc pas si loin de la frontière en termes de potentiel ! Il faut noter que Mistral est la seule entité européenne qui a l’argent, les talents et les centres de calcul pour ne pas être totalement larguée. Je comprends bien ceux qui disent qu’ils veulent un projet pan-européen, qu’il faut plusieurs acteurs différents, que c’est toujours dangereux la politique du champion unique. Mais en gros, on n’a plus le temps. Fallait se poser la question dans les années 2000 quand on a décidé qu’on allait lâcher tout notre système numérique aux GAFAM. Les politiciens se réveillent 25 ans trop tard sur les questions de souveraineté numérique.
Pourquoi les modèles Mistral ne sont pas à la frontière attendue, si leur potentiel n’est pas si degueu ?
1.Mistral a initialement fait le pari de faire des modèles plus petits, plus spécialisés, tournant en local pour les grandes entreprises européennes qui ne veulent pas filer leurs data aux Américains. Stratégie initiale logique quand on voit à quel point personne en Europe ne s’est jamais battu sérieusement contre les GAFAM. Stratégie des interstices donc.
2.Sauf qu’entre-temps l’agentique est arrivé, qui permet aux IA de faire de longs travaux en autonomie. C’est grâce à l’agentique que l’on peut faire des armes cyber redoutables, grâce à l’agentique que l’on peut créer des chercheurs en IA auto-améliorants. Mistral a donc ajouté cette corde à son arc, tout en continuant à engranger des sous sur le marché biz souverain. Mais beaucoup de retard a été accumulé.
3.Aujourd’hui ce qu’il manque à Mistral, et qui fait que les Chinois à moyens similaires sont devant, ce n’est que partiellement du calcul supplémentaire, mais surtout plus de talents spécialisés en agentique, plus de data de qualité et plus de boucles de feedback en données réelles.
Bonne nouvelle, on peut régler tout ça facilement :
1. Plus de talents agentiques, faut aller les débaucher. Et si on ne veut pas qu’ils soient débauchés très loin, mais qu’ils rejoignent l’équipe cœur à Paris, c’est facile : on crée un régime social d’exception pour les chercheurs et ingénieurs en IA et robotique qui plafonne les cotisations sociales au-delà de 150k de salaire. Comme ça, embaucher un talent à Paris ne coûte pas deux fois le prix américain.
2. Plus de data, il faut que la France donne toute la data de qualité dont regorgent ses administrations. Data santé, data cyber, etc. Pour garder la confidentialité, il faut anonymiser. Il faut que seul l’entraînement ait accès aux données. Et pour que ce soit légal dans un cadre européen, il faut réserver l’accès à ces données aux seules entreprises européennes disposant d’une certaine puissance de calcul et capacité de sécurisation, et l’interdire aux entreprises non européennes.
3. Plus de feedback de données en conditions réelles : on fait passer l’intégralité des administrations françaises sur Mistral. Oui c’est moins bien que Claude au début, mais en même temps on n’a pas envie que les données des Français soient aux US, et ce n’est pas comme si les administrations françaises allaient perdre des parts de marché si elles étaient temporairement moins performantes. C’est d’ailleurs comme ça qu’a fait la Chine : pendant des années, avant que leurs systèmes s’améliorent, leurs administrations tournaient sur des logiciels locaux sous-optimaux.
Donc on récapitule :
Si la France n’a pas rapidement d’IA de frontière, elle est cuite pour ce siècle.
Elle n’est pas si en retard que certains voudraient le faire croire, par volonté de décourager ou par simple réflexe d’auto-flagellation bien gaulois.
On peut se mettre au niveau avec quelques mesures simples, juridiquement peu compliquées et qui ont fait leurs preuves ailleurs.
Faut arrêter de pleurer et se bouger maintenant.