Merci pour le resumé de mes posts que vous pouvez retrouver ici:
clubic.com/actualite-553272-…
Maintenant qu'on a ces quelques notions, je vous propose d'essayer de décrypter 6 annonces public. N'hésitez pas completer ou corriger mon analyse, j'suis pas un LLM :)
xAI (Twitter):
- Juillet 2023, on retrouve l'information sur 10k GPUs. L'argent, $500M vient probablement de la Serie A de xAI. Pas trouvé d'info sur le Datacenter de 10MW
- Grok1 est entrainé durant 3 mois puis mis en place en Novembre 2023. Grok2 est entraîné sur le même 10K GPU et est annoncé en Mai 2024. Depuis probablement ce Datacenter a été transformé en Datacenter d'Inference avec ses 10K GPU. Ca fait parti du cycle de vie de GPU: sur 5 ans, 2 ans pour l'entrainement et 3 ans pour l'inference. En suite, poubelle
- Avril 2024, Serie B avec $6.00B, pour mettre en place 120K GPU dans un Datacentre de 120MW. Mis en place dans un temps record, il a été utilisé pour entraîner Grok3 qui est en cours de finalisation.
- Décembre 2024, Serie C, $6.00B, pour mettre en place probablement les superchip.
Source:
x.ai/blog
Microsoft:
Pas mal d'annonces de Microsoft avec OpenAI. Je ne vais pas entrer dedans. Regardons plutôt les annonces en Europe:
- février 2024: 3.2Mde en Allemagne. On parle donc probablement de 80K GPU, à terme, pour faire tourner AI localement. Donc Inference. Pas d'invest dans le Datacenter. Donc location.
reuters.com/technology/micro…
- février 2024: 2.1Mde en Espagne. 60K GPU. Inference local. Datacenter en location
reuters.com/technology/micro…
- mai 2024: 4Mde en France. 100K GPU à terme. Inference locale en France. Pas de Datacenter en location
news.microsoft.com/fr-fr/202…
- octobre 2024: 4.3Mde en Italie. 100K GPU à terme. Inference locale en Italie. Datacenter en location
news.microsoft.com/it-it/202…
EAU en France
Nous avons eu l'annonce d'un investissement en France entre 30Mde et 50Mde dans un Datacenter AI par Emirats Arabes Unis. Il s'agit probablement d'un investissement dans les Datecenters les GPUs. Vu les sommes, on parle jusqu'à 1M de GPUs. En fonction de besoins, cela pourra probablement se tranduire en investissement de plusieurs Datacenters d'Inference ou d'un Datacenter d'entraînement. L'avenir nous le dira.
Source:
lemonde.fr/economie/article/…
Une information importante: certaines sources annoncent que la production annuelle de GPU du type H100 de NVidia est de 2M d'Unités par an (seulement). A confirmer.