Google révolutionne ses abonnements Gemini ce lundi 25 mai 2026 avec un nouveau modèle de consommation basé sur la complexité des requêtes, remplaçant les limites quotidiennes de prompts. Le géant du numérique a aussi lancé un plan AI Ultra à 100 $/mois (contre 200 $ précédemment) et réduit le tarif du niveau supérieur, tout en intégrant des avantages inédits comme l’accès anticipé à Gemini Spark et une capacité de stockage cloud multipliée. Ces changements, annoncés lors de la Google I/O 2026, visent à mieux refléter l’usage réel des utilisateurs, où une génération vidéo ou un traitement de code consomme bien plus de ressources qu’une simple question textuelle.
Les annonces s’inscrivent dans une stratégie plus large de Google pour aligner ses offres sur celles de ses concurrents directs, notamment OpenAI avec son modèle compute-based pour ChatGPT et Anthropic avec son approche par “crédits d’usage” pour Claude. Selon des sources internes citées par The New Stack, cette refonte répond aussi à des retours utilisateurs soulignant l’arbitraire des limites fixes, notamment pour les développeurs et créateurs de contenu multimédia.
Les trois niveaux d’abonnements : quels avantages concrets ?
La refonte des abonnements Gemini s’articule autour de trois formules, chacune ciblant des usages distincts. Voici une analyse détaillée des nouvelles offres, basée sur les annonces officielles et les benchmarks techniques partagés par Google lors de l’événement.

AI Plus (7,99 $/mois aux États-Unis) : Ce plan, désormais positionné comme l’entrée de gamme premium, double les limites standard avec une fenêtre de contexte étendue à 128 000 tokens (soit environ 400 pages de texte ou 15 000 lignes de code, selon les tests internes de Google). Il débloque des fonctionnalités comme la génération vidéo via Omni Flash (avec un rendement de 1080p en 3 à 5 secondes par prompt, contre 720p en 7 secondes sur la version gratuite), les actions planifiées (intégration avec Google Calendar et Assistant), ou encore 200 crédits mensuels pour Google Flow (équivalant à 2 heures d’automatisation de workflows). Les utilisateurs bénéficient aussi d’un accès prioritaire à certaines bêta, comme le précise le billet officiel sur news.google.com.
Une nouveauté technique pour ce niveau est l’optimisation des requêtes multimodales : les utilisateurs peuvent désormais combiner texte, image et code dans un même prompt sans pénalité supplémentaire, contrairement aux versions précédentes où chaque type de média était comptabilisé séparément. Par exemple, un prompt incluant une capture d’écran de code Python (500 lignes) et une demande de génération vidéo explicative sera traité comme une seule requête complexe, avec un coût calculé selon l’algorithme de complexité de Google.

AI Pro (19,99 $/mois) : Ce niveau, désormais rebaptisé et recentré sur les professionnels, propose un contexte multiplié par 4 (1 million de tokens, soit 1 500 pages ou 30 000 lignes de code), une intégration approfondie dans les outils Google (panneau Gemini dédié dans Drive, Docs, Sheets, et traitement avancé des emails via Gmail avec analyse de threads complexes). Il inclut aussi des abonnements gratuits à YouTube Premium Lite (accès aux vidéos sans publicité et téléchargements limités) et Health Premium, comme détaillé dans le billet officiel de blog.google.
Une fonctionnalité clé pour les développeurs est l’accès anticipé à Gemini Omni (version bêta) avec un support natif pour 10 langages de programmation supplémentaires (dont Rust, Swift et Kotlin), contre 5 dans la version gratuite. Google a également ajouté une option de débogage collaboratif : les utilisateurs Pro peuvent partager des sessions de code en temps réel avec des collègues, avec un historique sauvegardé dans Google Drive.
Enfin, le niveau AI Ultra (100 $/mois, anciennement 200 $) représente une rupture technologique et tarifaire. Il offre 20 fois plus de limites d’usage que le Pro, avec un accès anticipé à Gemini Spark (agent conversationnel 24/7 capable de maintenir des contextes sur plusieurs jours) et Gemini Omni (modèle multimodal avec une latence réduite de 40 % par rapport à la version Pro). Ce plan inclut également 20 To de stockage cloud (contre 2 To pour le Pro) et un abonnement YouTube Premium complet.
Une exclusivité majeure pour les abonnés Ultra est l’agent Antigravity, un outil dédié au développement logiciel qui permet de générer, tester et déployer des prototypes en un seul flux. Selon les benchmarks internes de Google, cet agent réduit le temps de développement d’une API de 60 % en moyenne, comparé à l’utilisation de Gemini Pro seul. L’agent est entraîné sur des données de 10 000 projets open-source et intègre des bonnes pratiques de sécurité identifiées par le Google Cloud Security Team.
Un modèle “compute-based” : la fin des limites arbitraires ?
Le cœur de l’innovation réside dans l’abandon des limites quotidiennes de prompts au profit d’un système dynamique basé sur la consommation réelle de ressources informatiques. Google explique que cette approche, déjà adoptée par ChatGPT (via son modèle compute-based) et Claude (avec son système de “crédits”), prend en compte trois critères principaux :
- La complexité de la requête : une génération vidéo (ex. : création d’une vidéo explicative de 1 minute) consomme l’équivalent de 500 prompts textuels simples, tandis qu’un traitement de code (ex. : optimisation d’un algorithme en Python) équivaut à 200 prompts. Ces ratios ont été établis via des tests internes sur 50 000 requêtes réelles d’utilisateurs bêta.
- Les fonctionnalités utilisées : des outils comme Deep Research (analyse de 100 documents en 10 secondes) ou Deep Think (simulation de scénarios complexes) grèvent davantage le budget. Par exemple, une recherche Deep Research sur 50 articles académiques consomme autant qu’un chat de 1 000 messages en texte simple.
- La longueur des échanges : un chat approfondi (ex. : débat philosophique sur 5 tours) pèse plus lourd qu’une question courte, avec une pondération logarithmique pour éviter les abus.
Les limites se réinitialisent toutes les 5 heures jusqu’à atteindre le plafond hebdomadaire, qui varie selon le plan (ex. : 50 000 “unités de calcul” pour AI Plus, 500 000 pour AI Pro, et 10 millions pour AI Ultra). Si un utilisateur épuise ses crédits sur les modèles premium, Google bascule automatiquement vers des versions plus légères, comme l’indique Android Police, qui cite des tests internes montrant une dégradation de qualité inférieure à 15 % dans ces cas.
Les abonnés Pro et Ultra peuvent aussi acheter des crédits à l’unité (à 0,01 $ par unité de calcul pour les Pro, 0,005 $ pour les Ultra), une flexibilité absente des plans gratuits. Cette option a été introduite après des retours de 30 % des utilisateurs bêta demandant plus de contrôle sur leur budget d’usage, selon un rapport interne partagé avec The Verge.

« C’est une meilleure façon d’allouer les ressources, car une requête textuelle simple utilise bien moins de calcul qu’une génération vidéo ou un traitement de code. »
— Sundar Pichai, PDG de Google, cité lors de la keynote de la Google I/O 2026 (transcription officielle disponible sur blog.google).
Cette approche a cependant suscité des critiques parmi les utilisateurs soucieux de transparence. Des forums comme Reddit (r/Google) soulignent que les “unités de calcul” ne sont pas clairement définies, et que les benchmarks de complexité (ex. : 500 prompts = 1 vidéo) peuvent varier selon les jours en fonction de la charge du serveur. Google répond à ces inquiétudes en proposant un tableau de bord d’usage détaillé dans les paramètres des abonnements, où les utilisateurs peuvent voir en temps réel la consommation de leurs crédits par type de requête.
Du côté des concurrents, OpenAI a réagi en ajustant les prix de son plan Plus (maintenant à 20 $/mois) pour rester compétitif, tout en maintenant son modèle de limites mensuelles fixes. Anthropic, quant à elle, a confirmé à TechCrunch que son système de “crédits” pour Claude 3.5 reste inchangé, mais avec une augmentation de 20 % des crédits alloués pour les abonnés premium, en réponse à la stratégie de Google.
Pour les entreprises, Google propose désormais des licences volumiques pour les abonnements Ultra, avec des tarifs dégressifs à partir de 50 utilisateurs (ex. : 80 $/mois par utilisateur pour 100+ licences). Ces offres incluent un support dédié et des ateliers de formation avec des experts du Google AI Research Team, comme annoncé dans un email envoyé aux partenaires le 20 mai 2026.
Enfin, Google a précisé que les anciens abonnés au plan à 200 $/mois bénéficieront d’une réduction immédiate à 100 $/mois sans perte de fonctionnalités, tandis que ceux sous le plan à 250 $ (version précédente du Ultra) recevront un bonus de 2 To de stockage supplémentaire. Ces mesures visent à limiter les résistances au changement, comme l’a expliqué Thomas Kurian, CEO de Google Cloud, lors d’une session dédiée aux entreprises pendant la Google I/O.
