Tokenflation

Guerre des prix dans l'IA?

In partnership with

La perspective d’un accord entre les Etats-Unis et l’Iran, le trente-neuvième depuis le début des hostilités, et dans une moindre mesure l’IPO de SpaceX, permettent aux indices mondiaux de rebondir en fin de semaine.

OpenAI et Anthropic s’apprêteraient à entamer une guerre des prix, alors que les investissements dans l’infrastructure IA reposent assez largement sur eux, en particulier OpenAI.

Macro 🔭

Aux Etats-Unis, l’indice NFIB d’optimisme des PME baisse encore en mai. Particulièrement impactées par la hausse des prix du fuel, elles citent l’inflation et les taxes comme principaux sujets d’inquiétude. Les prix à la consommation augmentent de 4,2% en mai, marquant une nouvelle accélération de l’inflation (3,8% en avril), et les prix à la production progressent de 6,5%, un plus-haut depuis novembre 2022. L’indice de confiance du consommateur de l’université du Michigan marque néanmoins la première inflexion positive depuis le début de l’année.

Dans la zone €, la BCE relève ses taux directeurs pour la première fois en près de trois ans, à l’unanimité, alertant sur une inflation qui dépasserait les seuls prix de l’énergie, ainsi que sur les risques à la baisse pour la croissance. L’indice Sentix de sentiment des investisseurs reste négatif mais s’améliore un peu.

Au Japon, l’enquête Eco Watchers de sentiment dans les services, mal orientée depuis le début du conflit au Moyen Orient, repart à la hausse en mai. Les prix à la production affichent 6,3% de hausse en mai.

La Chine a vu ses exportations progresser de 19% en mai, en accélération marquée par rapport au mois précédent, et en forte progression vers les Etats-Unis (+35%). Les importations progressent plus fortement encore (+27%), en provenance d’Asie notamment. L’inflation reste stable à 1,2% en mai, et comme partout dans le monde, la croissance des prix à la production accélère.

Micro 🔬

L’introduction en bourse de SpaceX a lieu au prix annoncé de 135$, et le titre termine sa première séance en hausse de 19%. L’opération, sursouscrite quatre fois, a attiré des ordres de particuliers à hauteur de 100 Md$, pour une allocation qui ne serait que de 15 Md$ environ. Avec 4 à 5% de flottant, cela pourrait soutenir le cours.

Oracle publie de bons résultats trimestriels, avec un chiffre d’affaires en hausse de 21%, des bénéfices par actions en hausse de 24%, et un carnet de commandes en hausse de 363% sur un an, pas loin de dix ans de chiffre d’affaires, dont la moitié viendrait d’OpenAI. Le titre baisse fortement en raison des dépenses d’investissement annoncées, et de la nouvelle levée qui s’avère nécessaire.

Le recours de plus en plus fréquent à des levées, de dette et d’action, pour financer les investissements dans l’infrastructure IA commence à inquiéter les marchés, comme en témoigne la performance négative de Meta depuis le début de l’année. Après 25 Md$ en obligations, la société envisagerait d’après Reuters une émission d’actions de plusieurs dizaines de milliards.

Illustrant les besoins croissants de financement d’infrastructure IA, Super Micro Computer, assembleur de serveurs et infrastructures de datacenters, perd près de 30% mercredi à l’annonce d’une levée destinée à financer l’exécution de son carnet de commandes.

Les plus prudents dans l’investissement dans l’intelligence artificielle, comme Apple, s’en sortent mieux cette année, mais le titre est pénalisé cette semaine par sa Wordlwide Developer Conference (WWDC) annuelle, qui dévoile une nouvelle édition de Siri qui rattrape tout juste les fonctionnalités des concurrents, avec beaucoup de retard.

TSMC confirme que la demande pour les semiconducteurs reste forte, avec des ventes en hausse de 30% en mai, en ligne avec le premier trimestre et l’objectif annuel.

La consolidation du secteur bancaire européen se poursuit : tandis qu’Unicredit renforce son contrôle en annonçant détenir 40% du capital de Commerzbank, BancoBPM annonce ouvrir des discussions de fusion avec Monte dei Paschi di Sienna, pour se voir doubler par une offre de rachat d’Intesa en numéraire et en actions. En cas de succès, Intesa MPS deviendrait la deuxième banque de la zone € en capitalisation boursière.

La minute innovation 🧚🏻

La fonctionnalité de reconnaissance faciale est déjà présente dans les lunettes connectées de Meta. Pas forcément utilisée, mais prête à l’être.

Oura, la startup finlandaise de bagues connectées valorisée 11 Md$, s’introduira en bourse aux Etats-Unis, où se trouvent la majorité de ses investisseurs et de ses employés.

OpenAI annonce avoir à son tour déposé un prospectus confidentiel auprès de la SEC en vue de son introduction en bourse. Si certaines sources mentionnent l’objectif de faire l’opération en septembre (avant celle d’Anthropic), d’autres dans les douze mois, le communiqué stipule que « cela pourrait prendre un certain temps, car certaines choses que nous voulons accomplir sont probablement plus faciles à réaliser en tant que société non cotée. » Peut-être les baisses de prix envisagées ? (cf le thème central de cette édition).

Tokenflation 🏷️

Selon le Wall Street Journal, OpenAI envisage une réduction drastique de ses prix, afin de devancer un mouvement similaire que préparerait Anthropic. Les LLM seraient-ils en train de se transformer en commodités, alors même que les investissements dans l’infrastructure destinée à les faire tourner explosent ?

L’économie des LLM repose sur la facturation au token, qui peut être un mot entier, une partie de mot, un simple espace ou un signe de ponctuation. En anglais, cent mots équivalent à environ 130 tokens, en français, compte tenu des accents et de la construction des mots, c’est plus de 150. La facturation est généralement au million de tokens, soit le texte sept à huit romans de taille moyenne (en anglais).

Les tokens d'entrée, ou input, correspondent à tout ce que vous envoyez à l'IA, à savoir votre question, les consignes système, l'historique de la conversation et les documents fournis en pièce jointe. Dans le cas d’une « conversation » avec ChatGPT ou un autre LLM gratuit ou à prix modique (les abonnements à 20€ par mois), pour éviter d’avoir à renvoyer l’intégralité des échanges (ce qui génère des coûts), les interfaces peuvent limiter la partie de l’historique transmise ou la résumer. Avec une API, les fournisseurs appliquent un mécanisme de mise en cache : si un texte d'entrée volumineux a été analysé récemment, son traitement ultérieur bénéficie d'une réduction de prix majeure pouvant aller jusqu'à 90 %.

Les tokens de sortie, ou output, correspondent au texte généré par l'IA. Ils coûtent beaucoup plus cher que les tokens d’entrée, la génération mobilisant une puissance de calcul plus importante.

Le marché peut être réparti, de manière simplifiée, en trois grandes catégories. Les modèles les moins chers privilégient la rapidité et les volumes élevés pour des tâches comme comme la classification d'emails ou le tri de données. Les prix peuvent commencer à 0,03$ par million de tokens en entrée et 0,12$ en sortie pour les modèles les moins chers. Une deuxième catégorie regroupe les modèles généralistes offrant un compromis entre coût, rapidité et capacité : compter 1,25 $ en entrée et 10 à 15 $ en sortie. Enfin, les modèles les plus avancés sont destinés aux tâches complexes de raisonnement, de programmation et d’orchestration d’agents, et peuvent aller jusqu’à 30$ en entrée et 180$ en sortie. L’intégralité des prix se trouve ici.

OpenAi et Anthropic s’apprêtent donc à revoir ces prix si l’on en croit la presse. Deux facteurs majeurs poussent à cette déflation forcée. D'une part, les entreprises font face à un mur budgétaire. Les flux de travail basés sur des agents IA, qui font interagir plusieurs modèles en boucle pour accomplir une tâche, consomment des volumes de tokens astronomiques. Uber aurait ainsi épuisé en quatre mois le budget consacré à l’IA pour l’ensemble de l’année 2026. Pour éviter que leurs clients ne brident leurs usages ou ne se tournent vers des modèles moins chers, les fournisseurs doivent réduire le coût par tâche accomplie. D'autre part, Anthropic gagne rapidement du terrain auprès des entreprises, notamment grâce à Claude Code. Dans le contexte des introductions en bourse envisagées par les deux concurrents, la priorité est à la capture agressive de parts de marché.

Qu'une entreprise utilise OpenAI, Anthropic, Google ou un modèle open-source (comme Llama de Meta) hébergé localement, des couches d’abstraction (LiteLLM par exemple) permettent de changer assez facilement de modèle, même si l’interchangeabilité n’est pas parfaite. Certains usages des LLM sont donc proches de la « commodité » : le choix dépend de plus en plus du prix et de la latence.

L’histoire d’Internet fournit une analogie imparfaite mais instructive. La valeur ne s’est pas concentrée durablement dans les seuls protocoles ou navigateurs : elle s’est en grande partie déplacée vers les plateformes, les logiciels et les services construits au-dessus de l’infrastructure. Dans l’IA également, une part de la différenciation pourrait migrer des modèles fondamentaux vers les applications.

Or, les investissements considérables engagés actuellement sont destinés à des infrastructures dont OpenAI est l’un des principaux clients (cf Le maillon faible pour le détail de la chaîne de valeur), ce qui explique le parallèle que certains font avec la fin des années 90 : non parce que la demande serait fictive, mais parce que des investissements bien réels peuvent produire des rendements décevants lorsque les capacités augmentent plus vite que les revenus et que la concurrence fait chuter les prix. Cette inquiétude contribue à expliquer la contre-performance relative des Magnificent Seven depuis le début de 2026.

Your prompts are leaving out 80% of what you're thinking.

When you type a prompt, you summarize. When you speak one, you explain. Wispr Flow captures your full reasoning — constraints, edge cases, examples, tone — and turns it into clean, structured text you paste into ChatGPT, Claude, or any AI tool. The difference shows up immediately. More context in, fewer follow-ups out.

89% of messages sent with zero edits. Used by teams at OpenAI, Vercel, and Clay. Try Wispr Flow free — works on Mac, Windows, and iPhone.

Cet article ne constitue pas une recommandation d’investissement sur les thèmes ou les titres mentionnés.