En bref
- La demande en IA explose et dépasse les capacités d’infrastructure disponibles.
- Meta utilise aussi Gemini et Claude car ses propres modèles Llama ne suffisent pas sur certaines tâches.
- Malgré des investissements massifs, la pénurie de puissance de calcul fait grimper les coûts et limite l’usage.
Les géants de l’IA vendent le futur, mais ils coincent sur un truc très terre à terre, la puissance de calcul. Et visiblement, même Meta n’y échappe pas.
La ruée vers l’IA bute sur un mur très concret
D’après des informations rapportées par le Financial Times, Google a dû limiter l’usage de son modèle Gemini par Meta après un dépassement de capacité. Ce n’est pas juste une friction entre deux mastodontes. C’est surtout le signe que les besoins explosent plus vite que l’infrastructure.
On parle souvent des modèles, moins des machines derrière. Pourtant, c’est là que ça coince. Les grands groupes ont de plus en plus de mal à obtenir assez de ressources pour leurs propres usages, alors pour les clients, vous imaginez la pression. Résultat, le prix des tokens grimpe, et certaines entreprises commencent déjà à lever le pied.
Pourquoi Meta s’appuie sur Gemini malgré Llama ?
Le point le plus intéressant, c’est que Meta ne s’appuie pas sur Gemini pour un usage secondaire. Le modèle sert sur des tâches très concrètes, du code aux chatbots pour annonceurs, en passant par le service client, la détection des arnaques et le retrait de contenus nuisibles.
Si Meta a choisi ce modèle, c’est parce qu’il faisait mieux que ses propres modèles Llama sur ces cas précis. Ça pique un peu quand on pousse sa propre famille de LLM à ce niveau. Et ce n’est pas tout, puisque le groupe utilise aussi Claude, le modèle d’Anthropic, pour des besoins comparables. En gros, même un acteur qui développe ses propres briques va chercher ailleurs quand ça marche mieux.
Google a dû poser une limite et Meta a serré la vis
Selon ces mêmes informations, Google avait prévenu Meta dès mars 2026 de ses limites de capacité. Derrière, Meta aurait demandé à ses employés d’utiliser les tokens de façon plus efficace.
Ce détail dit beaucoup. Quand une boîte de cette taille commence à rationner en interne, on n’est plus dans le confort. On est dans l’optimisation forcée.
Des milliards injectés, mais toujours pas assez
Le paradoxe est assez brutal. Meta, qui n’exploite pas sa propre activité cloud, accélère en parallèle sur les data centers et a promis environ 600 milliards de dollars d’investissements dans le cloud sur les deux prochaines années.
Mais même avec des sommes pareilles, la capacité manque encore. Google lui-même a récemment accepté de payer environ 920 millions de dollars à SpaceX pour utiliser les data centers de xAI, afin d’obtenir la puissance supplémentaire nécessaire à Gemini Enterprise.
Et le plus fou, c’est que les gros consommateurs d’IA profitent du boom pendant que les fournisseurs, eux, ne gagnent pas encore vraiment d’argent. Les revenus générés restent faibles face aux coûts. Beaucoup de hype, oui. Mais derrière l’écran, la facture est déjà monstrueuse.