L’API Gemini, MCP, Jules, Antigravity et Project Mariner
Vous avez utilisé Gemini via l’interface web et Workspace. Cet article passe de l’autre côté du rideau : l’API qui propulse les workflows agentiques à l’échelle entreprise, le support MCP natif qui connecte Gemini à n’importe quelle source de données, Jules qui crée des pull requests pendant que vous dormez, Antigravity 2.0 qui réinvente l’IDE autour de l’agent, et Project Mariner qui contrôle le navigateur. Le volet développeur complet de l’écosystème Google AI.
À Cloud Next 2026, Thomas Kurian a renommé Vertex AI en Gemini Enterprise Agent Platform, avec un Model Garden de plus de 200 modèles, le protocole A2A v1.2 en production chez 150 organisations, et l’ADK v1.0 stable sur quatre langages. À Google I/O, Google a ensuite dévoilé Antigravity 2.0 et entamé la transition de Gemini CLI vers Antigravity CLI. Au-dessus de la couche infrastructure de l’écosystème Gemini, une suite développeur complète : API, CLI, IDE, agent de code asynchrone, agent navigateur.
Cet article est plus technique que les précédents. Il s’adresse aux développeurs, aux CTO et aux profils techniques qui veulent construire avec Gemini, pas seulement l’utiliser.
L’API Gemini, la Gemini Enterprise Agent Platform (ex-Vertex AI), Antigravity 2.0 et les serveurs MCP managés Google sont disponibles en France. Jules est en bêta avec un support officiel en anglais, mais accessible depuis la France. Project Mariner reste réservé au palier AI Ultra le plus élevé, d’abord aux États-Unis. La résidence des données en Europe est disponible via la Gemini Enterprise Agent Platform pour les entreprises soumises au RGPD.
L’API Gemini : modèles, pricing et context window
L’API Gemini est accessible via Google AI Studio (prototypage) et la Gemini Enterprise Agent Platform (ex-Vertex AI, pour la production entreprise). Les modèles sont identiques dans les deux environnements ; seuls le pricing, les quotas et les fonctionnalités entreprise (VPC, IAM, audit, résidence des données) diffèrent. Depuis Google I/O, Gemini 3.5 Flash est le modèle GA par défaut, et Gemini 3.5 Pro est en preview.
| Modèle | Input (≤200k) | Output | Contexte |
|---|---|---|---|
| Gemini 3.5 Flash (GA, défaut) | 1,50 $/M tokens | 9,00 $/M tokens | 1M tokens |
| Gemini 3.5 Pro (preview) | tarif à venir | tarif à venir | 2M tokens (visé) |
| Gemini 3.1 Pro (génération précédente) | 2,00 $/M | 12,00 $/M | 1M tokens |
| Gemini 3.1 Flash-Lite | Le plus économique | Faible latence | 1M tokens |
Le point clé du pricing : sur les modèles Pro, le coût grimpe au-delà de 200k tokens de contexte (l’output de Gemini 3.1 Pro passe ainsi à 18 $/M au-dessus de 200k). Un pipeline RAG qui inclut de gros documents peut silencieusement pousser chaque requête dans la tranche supérieure. Le routing entre modèles — envoyer les requêtes simples vers Flash ou Flash-Lite et réserver Pro pour le raisonnement complexe — reste la principale source d’économies.
Le Batch API offre 50 % de réduction pour le traitement asynchrone sous 24 heures. Pour les volumes importants de classification, d’extraction ou de résumé, c’est souvent le meilleur rapport qualité-prix. Sessions et Memory Bank sont par ailleurs en disponibilité générale (facturation active).
Dates de retirement à connaître
Les modèles Gemini 2.0 Flash et 2.0 Flash-Lite ont déjà été retirés. Les modèles Gemini 2.5 Pro, 2.5 Flash et 2.5 Flash-Lite seront retirés le 16 octobre 2026 : planifiez les migrations vers Gemini 3.5 Flash ou 3.1 Flash-Lite selon vos cas d’usage. Côté image, l’endpoint gemini-3.1-flash-image-preview est programmé pour coupure le 25 juin 2026, à migrer vers la version GA correspondante. Les anciens modèles Imagen et Veo GA sont également en retirement.
Les modèles spécialisés de l’API
Au-delà des modèles généralistes, l’API expose une gamme de modèles spécialisés, lancés au fil des dernières mises à jour :
- Gemini 3.1 Flash-Lite — le modèle le plus économique, optimisé pour la basse latence et les volumes élevés.
- Gemini 3.1 Flash Image (Nano Banana 2) — génération d’images avec un meilleur pricing et une latence réduite.
- Gemini 3.1 Flash TTS — text-to-speech avec emotion tags, contrôle du pacing, des accents et des pauses.
- Veo 3.1 Lite — modèle vidéo à coût réduit pour les applications à fort volume.
- Gemini Embedding 2 — premier modèle d’embedding nativement multimodal de Google : texte, images, vidéo, audio et documents dans un même espace.
- Deep Research dans l’API — en deux variantes, l’une orientée vitesse et streaming, l’autre exhaustivité maximale, avec planification, intégration MCP et File Search.
- Gemini Robotics-ER 1.6 — modèle robotics avec lecture d’instruments et raisonnement spatial amélioré.
- Computer Use — exposé en preview via les modèles Pro de l’API, pour construire des agents qui naviguent sur le web directement depuis votre code.
Fonctionnalités API notables
- Function calling — Gemini peut appeler des fonctions que vous définissez, recevoir les résultats, puis les intégrer dans sa réponse. Les modèles 3.5 utilisent un processus de « thinking » interne qui améliore la sélection de fonctions et de paramètres, avec un endpoint dédié pour mixer commandes bash et outils custom.
- Structured output — spécifiez un schéma JSON, et Gemini le respecte. Essentiel pour l’extraction de données et l’intégration avec des systèmes existants.
- Multimodal natif — texte, images, vidéo, audio et PDF dans le même appel API. Support des buckets Cloud Storage et des URLs pré-signées comme sources, fichiers jusqu’à 100 Mo.
- Grounding — connectez les réponses à Google Search ou Google Maps pour les ancrer dans des données vérifiées en temps réel.
- Thinking levels — niveaux de raisonnement (minimal, low, medium, high) configurables par requête, l’effort par défaut étant désormais « medium ». Détails dans notre guide prompt engineering.
Support MCP natif : Gemini parle le protocole universel
L’API et le SDK Gemini supportent nativement le Model Context Protocol (MCP), le standard ouvert pour connecter les modèles IA à des sources de données et outils externes. Vous combinez des connecteurs MCP et le function calling natif de Gemini dans une seule requête. Google a adopté MCP à travers ses services, puis l’a étendu massivement à Cloud Next 2026.
Serveurs MCP managés par Google
Google propose des serveurs MCP entièrement managés pour ses services :
- Google Maps — données géospatiales, lieux, itinéraires, météo.
- BigQuery — requêtes SQL, schémas, forecasting.
- Compute Engine — gestion de VMs.
- Google Kubernetes Engine — gestion de clusters K8s.
- Cloud Storage — avec Smart Storage, analyse automatique des données non structurées et génération de métadonnées contextuelles.
- À venir : Cloud Run, Spanner, Looker, Pub/Sub.
Apigee comme bridge MCP universel
Annoncé à Cloud Next 2026 : Apigee, la plateforme de gestion d’API de Google, fonctionne désormais comme bridge MCP. Elle traduit n’importe quelle API REST standard en outil agent découvrable, avec les contrôles de sécurité et de gouvernance Apigee existants. Concrètement, vos APIs internes deviennent instantanément utilisables par des agents sans écrire de serveur MCP custom. Le Workspace MCP Server est par ailleurs en preview pour exposer Gmail, Calendar, Docs, Sheets et Drive à des agents tiers.
L’intérêt par rapport aux serveurs MCP communautaires : fiabilité, sécurité entreprise (IAM, VPC Service Controls, logs d’audit), et pas de maintenance côté développeur. Vous pointez votre agent vers un endpoint Google, et il accède aux données avec les mêmes contrôles que le reste de votre infrastructure Cloud.
MCP en ligne de commande
Les CLI de Google supportent les serveurs MCP via un fichier de configuration. Vous connectez des serveurs locaux (stdio) ou distants (HTTP/SSE) et les utilisez comme outils supplémentaires dans vos sessions. La configuration se transpose d’une CLI à l’autre : c’est un point d’attention lors de la migration de Gemini CLI vers Antigravity CLI, où un réglage MCP mal repris échoue parfois en silence.
# Configuration MCP (settings.json)
{
"mcpServers": {
"bigquery": {
"type": "url",
"url": "https://mcp.googleapis.com/bigquery",
"trust": true
},
"mon-serveur-custom": {
"type": "stdio",
"command": "npx",
"args": ["-y", "mon-package-mcp"],
"env": {
"API_KEY": "votre-cle"
}
}
}
}
A2A v1.2 : le protocole d’orchestration entre agents
Le protocole Agent2Agent (A2A) a atteint la version 1.2, avec 150 organisations en production. Il est gouverné par la Linux Foundation via l’Agentic AI Foundation, et les agent cards signés utilisent des signatures cryptographiques pour la vérification de domaine.
A2A est complémentaire à MCP. MCP gère la connexion d’un agent à des outils et sources de données ; A2A gère la communication entre agents, à travers organisations et plateformes. Un agent construit sur une plateforme peut passer une tâche à un agent Gemini, qui interroge un autre agent tiers, le tout via A2A, sans qu’aucun système n’ait besoin de comprendre l’architecture interne des autres.
Le support A2A est intégré nativement dans l’Agent Development Kit de Google, LangGraph, CrewAI, LlamaIndex Agents, Semantic Kernel et AutoGen.
ADK v1.0 : le kit de développement d’agents stable
L’Agent Development Kit open-source de Google est stable en version 1.0 sur quatre langages : Python, Go, Java, TypeScript. L’ADK gère la définition d’agents, le routing de modèles, l’intégration MCP, la persistance de sessions, enfin la communication A2A.
Nouveautés Cloud Next : Agent Designer (builder low-code pour créer des agents sans tout coder), Inbox for managing agents (interface centralisée pour gérer les agents en production), et une intégration native avec la Gemini Enterprise Agent Platform. Le Model Garden propose désormais plus de 200 modèles, dont Claude, Llama, DeepSeek-V3.2 et GLM 5 en expérimental : vous mixez les modèles dans un même workflow selon les besoins.
Jules : l’agent de code asynchrone
Jules est l’agent de code autonome de Google. Vous lui assignez une tâche via GitHub (bug fix, refactoring, implémentation de feature, écriture de tests), et il travaille de façon asynchrone : il clone votre repository dans une VM cloud, analyse le code, développe un plan, exécute les modifications, puis crée une pull request. Vous relisez, approuvez et mergez.
Ce que Jules fait concrètement
Jules lit les descriptions d’issues GitHub, comprend l’intention, explore le codebase, puis produit des changements ciblés avec un diff que vous pouvez inspecter. Il ne se contente pas de générer du code : il l’exécute, le teste, et corrige les erreurs avant de soumettre. Pour les tâches de maintenance (corrections de bugs, mises à jour de dépendances, refactoring), Jules élimine ainsi le travail répétitif qui consomme le temps des développeurs seniors.
Plans et limites
| Plan Jules | Tâches/jour | Concurrence |
|---|---|---|
| Free | Limité | 1 |
| AI Pro (inclus) | 100 | 15 |
| AI Ultra (inclus) | 20x les limites Pro | Multi-agent |
Jules tourne sur la génération Gemini 3.5, optimisée pour les tâches agentiques et le code. Il reste en bêta : l’anglais est la seule langue officiellement supportée, et la capacité est soumise à la disponibilité des ressources, pas garantie aux heures de pointe.
Antigravity 2.0 : la plateforme de développement agent-first
Antigravity est la plateforme de développement agentique de Google. Lancée fin 2025, elle est passée à Antigravity 2.0 à Google I/O : ce n’est plus un éditeur de code avec un chatbot greffé, mais une suite agent-first complète qui regroupe une application desktop (IDE bâti sur Open VSX), une CLI, un SDK, un palier Managed Agents API, et un chemin de déploiement entreprise via la Gemini Enterprise Agent Platform.
Le concept : l’agent au centre
Dans un IDE classique, l’IA est un assistant dans un panneau latéral. Dans Antigravity, l’agent est le pilote : il explore le codebase, planifie les tâches, exécute les modifications, ouvre un navigateur pour tester, puis présente ses résultats sous forme d’« artifacts » (plans, diagrammes, captures d’écran, diffs) que vous validez ou commentez comme dans un Google Doc. La plateforme propose un mode « Editor » classique (IDE + agent latéral) et un mode « Manager » agent-first où l’agent est au centre. Antigravity 2.0 intègre désormais l’orchestration multi-agents au niveau de la plateforme, et le feedback que vous donnez est réinjecté dans les exécutions futures.
Multi-modèles via Model Garden
Antigravity ne se limite pas à Gemini : la plateforme s’appuie sur le Model Garden et ses 200+ modèles. Vous choisissez le moteur adapté à votre tâche — Gemini 3.5 Flash pour l’agentique et le code, Gemini 3.1 Pro pour certains raisonnements, ou des modèles partenaires. Ce choix signale l’approche interopérable de Google plutôt qu’un lock-in.
Disponibilité : gratuit en preview publique sur Mac, Windows et Linux. Les crédits Antigravity sont distincts des crédits IA Google : ils mesurent la consommation de tokens dans l’IDE.
De Gemini CLI à Antigravity CLI : la transition du 18 juin 2026
Changement majeur annoncé à Google I/O : le 18 juin 2026, Gemini CLI et les extensions IDE Gemini Code Assist cessent de servir les requêtes pour les comptes AI Pro, AI Ultra et les utilisateurs gratuits de Gemini Code Assist. Après cette date, l’authentification renvoie une erreur et les commandes échouent. Le remplaçant est Antigravity CLI, écrite en Go, invoquée via la commande agy.
Qui n’est pas concerné : les organisations disposant d’une licence Gemini Code Assist Standard ou Enterprise conservent l’accès, et Gemini CLI reste accessible via une clé API payante (Gemini API ou Gemini Enterprise Agent Platform). Pour les comptes individuels et gratuits, la migration vers Antigravity CLI est en revanche obligatoire, sans opt-out.
Antigravity CLI partage le même cœur d’agent qu’Antigravity 2.0 : les améliorations du desktop bénéficient automatiquement à la CLI. Elle reprend les mécanismes de Skills, Hooks et Subagents, mais bascule sur un modèle de traitement asynchrone en arrière-plan : vous lancez un refactoring massif ou une recherche multi-sources sans bloquer votre session. Google précise toutefois qu’il n’y a pas de parité fonctionnelle 1:1 au lancement : testez vos workflows custom avant la date butoir.
# Transition CLI — repères clés (18 juin 2026)
# AI Pro / Ultra / gratuit -> migration obligatoire vers Antigravity CLI (agy)
# Licence Code Assist Enterprise -> accès Gemini CLI inchangé
# Cle API payante -> Gemini CLI reste utilisable
# Antigravity CLI : ecrite en Go, execution asynchrone,
# meme coeur d'agent que l'app Antigravity 2.0,
# support MCP via configuration (serveurs locaux stdio ou distants HTTP/SSE)
Jules pour les tâches asynchrones sur GitHub (bugs, refactoring, tests) : vous lui assignez un travail, il livre une PR. Antigravity CLI (agy) pour les tâches dans le terminal — debug, génération de scripts, exploration de code — en remplacement de Gemini CLI. Antigravity 2.0 desktop pour les projets complexes nécessitant un agent autonome avec vision du navigateur et planification multi-étapes. Les organisations sous licence entreprise conservent Gemini CLI et Code Assist. Aucun de ces outils ne remplace totalement les autres.
Project Mariner : l’agent qui contrôle le navigateur
Project Mariner est l’agent de navigation web de Google DeepMind. Il observe votre navigateur visuellement (comme un humain, pas en parsant le DOM), planifie les étapes nécessaires, puis exécute les actions : clics, saisie de formulaires, navigation entre pages, défilement, sélection. Le tout avec validation humaine avant les actions critiques (paiements, envois).
Le cycle Observe-Plan-Act
Mariner utilise une approche « vision-first » : il prend des captures d’écran du navigateur, les analyse avec Gemini, comprend la structure de la page, puis décide des actions. Cette approche le rend résistant aux changements de design des sites : les scripts d’automatisation classiques cassent dès qu’un bouton est déplacé, Mariner continue. Les capacités Computer Use sont par ailleurs exposées en preview dans l’API, pour construire des agents qui naviguent sur le web directement depuis votre code.
Disponibilité
L’usage de Project Mariner en tant que produit est réservé au palier AI Ultra le plus élevé, d’abord aux États-Unis. Il permet jusqu’à 10 tâches simultanées dans des sessions de navigateur isolées. Les capacités agentiques alimentent aussi AI Mode dans Google Search (réservation de restaurants, achat de billets), accessibles à un public plus large. Combiné au protocole de commerce agentique annoncé à Cloud Next (compatible A2A, AP2 et MCP), Mariner permet enfin des transactions marchandes standardisées avec les partenaires du protocole.
Gemini Enterprise Agent Platform : l’échelle entreprise
Renommée à Cloud Next 2026 (anciennement Vertex AI), la Gemini Enterprise Agent Platform est la couche entreprise de l’écosystème. Elle ajoute au-dessus de l’API Gemini des quotas dédiés, la résidence des données par région (Europe incluse pour le RGPD), des contrôles IAM granulaires, le support VPC-SC, les logs d’audit, la facturation centralisée, enfin l’accès aux 200+ modèles du Model Garden.
Nouveautés Cloud Next : Managed Lustre (bande passante jusqu’à 10 TBps), Object Storage Rapid tier (latence sub-milliseconde via Colossus), Smart Storage avec serveur MCP managé et Knowledge Catalog contextuel, cross-cloud data lakehouse (fédération sans copie des données), et Comments to SQL dans BigQuery (requêtes en langage naturel). Pour les entreprises qui construisent des produits sur Gemini, c’est le chemin de production recommandé.
Par où commencer en tant que développeur
Allez sur aistudio.google.com et testez Gemini 3.5 Flash avec vos propres prompts, en appliquant les techniques de prompt engineering Gemini. Utilisez le function calling et le structured output, puis exportez le code en Python ou Node.js quand votre prompt est validé.
Si vous utilisiez Gemini CLI, basculez sur Antigravity CLI (agy) avant le 18 juin 2026. Testez une tâche simple dans le terminal et vérifiez votre configuration MCP, qui présente un piège silencieux à la migration. Les comptes entreprise et les clés API payantes conservent Gemini CLI.
Ajoutez un serveur MCP managé (BigQuery, Maps, Cloud Storage) à votre CLI ou votre application, fiabilité et sécurité entreprise incluses. Testez le function calling combiné aux outils MCP. Pour exposer vos APIs internes, utilisez Apigee comme bridge MCP.
Connectez Jules à un de vos repos GitHub et choisissez un bug ou un refactoring simple. Observez le plan produit, le diff créé et la PR soumise, puis évaluez la qualité avant de lui confier des tâches plus complexes.
Téléchargez Antigravity 2.0 (gratuit en preview), ouvrez un projet existant et donnez à l’agent une tâche de migration ou de restructuration. Observez le cycle artifacts -> feedback -> itération, et testez les modes Editor et Manager pour trouver celui qui correspond à votre workflow.
Ce que l’écosystème développeur change — et la suite
L’écosystème développeur de Google forme désormais une pile verticale complète : infrastructure (Gemini Enterprise Agent Platform, TPU, Managed Lustre), modèles (Model Garden 200+, Gemini 3.5 Flash et 3.5 Pro, 3.1 Pro, Embedding 2, Veo 3.1, Lyria 3 Pro), protocoles (MCP natif, A2A v1.2, commerce agentique), kit développeur (ADK v1.0, Agent Designer, Managed Agents API), outils (Antigravity 2.0, Antigravity CLI, Jules) et agents (Mariner, Computer Use dans l’API). Le tout avec la Linux Foundation qui gouverne A2A pour l’interopérabilité.
Les limites sont celles d’un écosystème en mutation rapide : Jules est en bêta avec des résultats inégaux, la transition de Gemini CLI vers Antigravity CLI est imposée sans parité fonctionnelle complète au lancement, Mariner reste expérimental et limité au palier Ultra le plus élevé, et la multiplication des outils crée une confusion sur lequel utiliser quand. Les retirements successifs imposent enfin une veille active sur les migrations.
Le prochain article zoome sur l’agent personnel le plus marquant de l’écosystème : Gemini Spark, l’agent autonome qui travaille en continu, même appareil éteint. Comment il s’appuie sur Workspace et MCP, ce qu’il sait faire, et ses limites actuelles.
Vous connaissez le volet développeur. Le chapitre suivant passe à Gemini Spark, l’agent autonome dévoilé à Google I/O : tâches en continu, exécution même appareil éteint, connecteurs Workspace et MCP, structure Tasks / Schedules / Skills. Ce qu’il change, et ses limites au lancement.