L’intelligence artificielle : des coûts qui grimpent et un nouveau dilemme pour les dirigeants
Lors du Web Summit 2022 à Lisbonne, Arvind Jain, PDG de Glean, a souligné que les budgets alloués à l’IA dans les grandes entreprises américaines s’épuisent souvent en un ou deux mois, alors qu’ils étaient initialement prévus pour une année entière. Cette constatation contraste fortement avec l’attente initiale selon laquelle le coût de l’IA aurait tendance à baisser avec la maturation de la technologie.
Une hausse soutenue du prix par jeton
Selon Jain, chaque nouveau modèle publié par les laboratoires de pointe coûte environ deux fois plus cher par jeton que celui qu’il remplace. Cette évolution place l’IA d’entreprise sur ce qu’il décrit comme « une voie non durable pour le moment ». En d’autres termes, le prix par unité de calcul augmente plus rapidement que la valeur générée par les applications actuelles.
Un déséquilibre entre valeur créée et dépenses engagées
Jain explique que, bien que l’IA soit puissante, son efficacité reste faible : la valeur produite par les systèmes d’IA est actuellement inférieure aux coûts supportés par les entreprises. Une grande partie du problème provient du choix des modèles. Environ 95 % de l’utilisation de l’IA en entreprise se fait encore sur les modèles frontières les plus coûteux, même pour des tâches qui pourraient être traitées par des alternatives moins onéreuses.
Le routage intelligent comme levier d’économies
Une solution simple consiste à diriger les tâches les moins complexes vers les modèles les plus abordables. Jain affirme qu’un bon routage en amont peut permettre de réaliser des économies pouvant atteindre dix fois le coût actuel. Cette approche repose sur l’idée que la plupart des tâches ne nécessitent pas la puissance maximale des derniers modèles.
Factory AI et la comparaison entre versions de modèles
Matan Grinberg, PDG de Factory AI, décrit le même phénomène comme un problème d’allocation des ressources qui se joue désormais au sein des équipes de direction. Il raconte que les entreprises passent généralement par trois phases en environ un an :
- Une première phase où les conseils d’administration enjoignent les PDG d’agir sur l’IA.
- Une deuxième phase, appelée « tokenmaxxing », où l’on utilise l’IA par tous les moyens nécessaires, indépendamment du coût.
- Une troisième phase où les dirigeants réévaluent l’utilité réelle des modèles premium.
Grinberg illustre la différence entre deux versions successives d’un modèle haut de gamme (par exemple Opus 4.7 vs Opus 4.8) en la comparant à la différence entre deux professeurs possédant respectivement treize et quinze ans d’expérience : pour un profane, la distinction est pratiquement imperceptible.
Vers une demande plus sensible au prix
Le modèle économique actuel de nombreux fournisseurs d’IA repose sur l’hypothèse que la demande restera largement insensible au coût. Toutefois, les retours du Fortune 500 suggèrent que les entreprises commencent à examiner de près le rapport coût‑bénéfice de leurs investissements en IA. Cette prise de conscience pourrait pousser les acteurs du marché à revoir leurs stratégies de tarification et à proposer des offres plus différenciées selon les besoins réels des clients.
Conclusion
L’intelligence artificielle offre indéniablement des capacités puissantes, mais son adoption actuelle révèle un écart croissant entre les dépenses engagées et la valeur réellement produite. En optimisant le choix des modèles – notamment par le routage intelligent des tâches vers des solutions moins coûteuses lorsqu’elles sont suffisantes – les entreprises peuvent non seulement réduire leurs factures, mais aussi aligner leurs investissements sur un cadre plus durable. Les témoignages d’Arvind Jain et de Matan Grinberg, appuyés par des observations concrètes du terrain, montrent que la voie vers une IA rentable passe par une gestion plus fine des ressources et une sensibilisation accrue au coût réel de chaque jeton utilisé.
