PROMPT

Guide IA

Prompt engineering Gemini : les techniques qui font la différence

Gemini 3 n’est pas un simple successeur de Gemini 2.5. Le modèle est moins verbeux par défaut, tolère mal les contraintes négatives placées au début du prompt, refuse les baisses de température et intègre trois niveaux de raisonnement pilotables. Bref, les prompts qui marchaient avant peuvent ne plus marcher aujourd’hui. Ce guide couvre les techniques documentées par Google pour exploiter Gemini 3 au maximum — celles qu’on ne trouve pas dans un tuto de prompt engineering générique.

L’écosystème Gemini repose sur trois modèles très différents en comportement : Gemini 3 Flash, Gemini 3.1 Pro et Gemini 3.1 Deep Think. Un même prompt peut donner trois résultats, selon le routing automatique, les thinking levels choisis et les instructions persistantes actives. Les techniques qui suivent sont tirées de la documentation officielle Google (Vertex AI et Gemini API, dernière mise à jour 22 avril 2026) et du retour d’usage sur les 5 derniers mois.

Les System Instructions : votre prompt permanent

Gemini offre deux niveaux d’instructions persistantes qui changent le comportement du modèle avant même que vous écriviez quoi que ce soit.

Instructions générales (Paramètres)

Dans les paramètres de l’app Gemini (Settings → Instructions personnalisées), vous définissez qui vous êtes, votre métier, vos préférences de ton et de format. Ces instructions s’appliquent à toutes vos conversations. Depuis avril 2026, une feature « Memory Import » permet aussi d’importer vos préférences depuis un autre assistant IA via un fichier ZIP ou un résumé copié-collé — vous ne repartez pas de zéro.

L’erreur la plus courante : y mettre trop de texte. Les instructions générales doivent tenir en moins de 500 mots. Au-delà, le modèle commence à ignorer les contraintes les moins saillantes — un phénomène documenté par Google appelé « attention dilution ».

Instructions de Gem (par tâche)

Les Gems sont des assistants personnalisés avec leurs propres instructions, fichiers de référence et outils par défaut. Contrairement aux instructions générales, un Gem ne s’applique que quand vous l’ouvrez. Vous pouvez en créer autant que nécessaire : un pour la rédaction, un pour l’analyse financière, un pour le debug de code.

La bonne pratique selon Google : traiter les instructions d’un Gem comme un programme, pas comme une conversation. Le framework qui fonctionne le mieux sur Gemini 3 est Role + Goal + Constraints + Examples + Output Format. Le rôle définit l’expertise, l’objectif dit quoi faire, les contraintes donnent les règles métier, les exemples montrent un ou deux cas concrets (pas plus — au-delà, le modèle sur-apprend), et le format spécifie la sortie attendue.

# Gem — Analyste de rapports annuels

Rôle : Tu es un analyste financier senior spécialisé dans
les sociétés cotées européennes.

Objectif : Quand je te donne un rapport annuel (PDF ou texte),
produis une analyse structurée.

Contraintes métier : Je suis directeur financier d'un fonds
d'investissement mid-cap. J'ai besoin d'identifier les
risques non évidents et les incohérences entre le discours
du management et les chiffres.

Exemple de signal d'alerte attendu : "Le rapport mentionne
une croissance organique de 8%, mais le détail par segment
(p.47) montre que 6 points viennent d'un effet de change
favorable non récurrent."

Format de sortie :
1. Résumé exécutif (5 phrases max)
2. Tableau : CA, EBITDA, dette nette, FCF (3 derniers exercices)
3. 3 signaux d'alerte (avec numéro de page source)
4. 2 questions à poser au management
5. Verdict : acheter / conserver / éviter — avec justification

Contrainte finale : si une donnée n'est pas dans le document,
écris "[donnée absente]". Ne jamais inventer un chiffre.

Ce Gem, une fois créé, transforme chaque upload de PDF en une analyse structurée en 30 secondes. Vous n’écrivez plus un seul prompt — vous uploadez et vous lisez.

Le multimodal natif : penser au-delà du texte

Gemini accepte en entrée du texte, des images, de la vidéo et de l’audio dans le même prompt. Ce n’est pas un ajout cosmétique — ça change fondamentalement la façon de formuler une demande. La documentation officielle précise que chaque modalité doit être traitée comme une entrée de même niveau : vos instructions doivent référencer explicitement chaque élément.

Images : extraction avant interprétation

Quand vous envoyez une image à Gemini, la meilleure approche est de demander d’abord une extraction factuelle (ce que l’image contient), puis une interprétation. Gemini 3 est optimisé pour des réponses directes et efficaces — sans cette étape, le modèle comble les zones d’ombre avec des déductions non signalées, ce qui dégrade la précision.

# Prompt multimodal — analyse d'image en deux temps

[Image uploadée : capture d'écran d'un dashboard Google Analytics]

Étape 1 : Décris factuellement ce que tu vois dans cette
capture d'écran. Liste tous les chiffres, libellés, axes
et légendes visibles.

Étape 2 : À partir de cette description, identifie les
3 tendances les plus significatives et propose 2 actions
concrètes pour améliorer le trafic organique.

Vidéo : timestamps et questions ciblées

Gemini traite des vidéos longues — jusqu’à une heure sur les plans payants, beaucoup plus via l’API. La clé : ne pas demander « résume cette vidéo ». Posez des questions précises ou demandez une extraction par timestamp. « À quel moment le présentateur mentionne le changement de pricing ? Que dit-il exactement ? » donne un résultat bien meilleur qu’un résumé générique.

Audio et vocal : le prompt conversationnel

Gemini Live tourne sur Gemini 3.1 Flash Live depuis mars 2026 et permet des échanges vocaux naturels. Vous pouvez montrer un objet à votre caméra en parlant — le modèle intègre les deux flux. Pour le prompt engineering vocal, la règle est simple : soyez aussi spécifique à l’oral qu’à l’écrit. « Qu’est-ce que tu penses de ça ? » donne un résultat vague. « Est-ce que cette pièce semble être un composant original pour une Fender Stratocaster des années 60 ? » donne un résultat utile.

Les thinking levels de Gemini 3.1 Pro

C’est la nouveauté de prompt engineering la plus structurante de l’année. Gemini 3.1 Pro introduit un paramètre thinking_level à trois valeurs : Low, Medium, High. Il remplace l’ancien thinking_budget des modèles 2.5. Chaque niveau arbitre différemment latence, coût et profondeur de raisonnement.

Low — Raisonnement minimal, réponse quasi instantanée. Idéal pour la classification, l’extraction simple, la transformation de format. Consomme peu de tokens.
Medium — Équilibre standard. Bon choix pour la revue de code, l’analyse de données courtes, la rédaction structurée.
High — Profondeur maximale. Pour le code complexe, la recherche, les problèmes multi-étapes. Latence plus élevée, meilleure qualité sur les tâches exigeantes.

Conséquence directe pour vos prompts : si vous venez de Gemini 2.5, vous avez probablement pris l’habitude de décomposer manuellement vos demandes en étapes (« d’abord fais A, ensuite B, puis C »). Sur Gemini 3, cette décomposition n’est plus nécessaire — elle est même contre-productive. Utilisez thinking_level: high et laissez le modèle décomposer lui-même. Les techniques chain-of-thought explicites de Gemini 2.x deviennent de l’overkill sur Gemini 3.

Prompter moins, penser plus

La documentation officielle Google Gemini 3 est explicite : « les prompts jugés safe sur Gemini 2.x peuvent ressembler à de l’overkill sur Gemini 3 ». Commencez par une phrase simple avec le bon thinking_level. N’ajoutez des contraintes que si la sortie dérive. C’est l’inverse du réflexe qu’on a pris avec les modèles précédents.

Le routing automatique Flash → Pro : comment il influence vos résultats

Quand vous utilisez l’app Gemini en mode « Auto », le système décide quel modèle traite votre requête. Les tâches simples (traduction, résumé court, question factuelle) sont envoyées à Flash. Les tâches complexes (analyse multi-étapes, raisonnement, code) sont envoyées à Pro. Vous ne choisissez pas — le routing décide pour vous.

Pourquoi c’est important pour le prompting : un prompt court et simple a de bonnes chances d’être traité par Flash. Si vous avez besoin de la qualité Pro, deux options :

Sélectionnez manuellement le modèle — Dans l’interface, cliquez sur le sélecteur de modèle et choisissez « 3.1 Pro » au lieu de « Auto ». Ça force l’utilisation du modèle, quelles que soient vos limites.
Rendez votre prompt suffisamment complexe — Si vous restez en Auto, structurez votre demande avec plusieurs contraintes explicites et un format de sortie détaillé. Le router interprète la complexité du prompt pour décider du modèle.

Quand Flash suffit

Gemini 3 Flash est le modèle par défaut de l’app depuis décembre 2025. Pour les tâches courantes (brouillons, résumés, questions-réponses, extraction), il atteint des performances qui rivalisent avec Gemini 2.5 Pro — et répond en une à deux secondes. Le routing n’est pas un piège, c’est une optimisation. La question n’est pas « Flash ou Pro ? » mais « cette tâche précise a-t-elle besoin de la profondeur de raisonnement de Pro ? »

Les spécificités de Gemini 3 documentées par Google

Le guide officiel de Google pour Gemini 3 révèle plusieurs comportements spécifiques qui justifient d’ajuster vos habitudes. Les connaître évite des frustrations inutiles.

Gemini 3 est moins verbeux par défaut

Par défaut, Gemini 3 répond de façon directe, concise, quasi sèche — bien moins bavard que les modèles 2.x. Si votre cas d’usage demande une réponse conversationnelle, explicative ou développée, vous devez le demander explicitement. Formulation recommandée par Google : « Explique cela comme un assistant amical et bavard. » Sans cette consigne, attendez-vous à des réponses courtes et sans prélude.

Les contraintes négatives sont fragiles

« Ne fais pas X » fonctionne moins bien sur Gemini 3 que sur ses prédécesseurs. Google le documente explicitement : les contraintes négatives (ce que le modèle ne doit pas faire) et les contraintes de format (longueur, structure) peuvent être ignorées si elles apparaissent trop tôt dans le prompt. La règle : placez vos restrictions à la fin de votre instruction, pas au début.

# Mauvais — contrainte au début, souvent ignorée

Ne dépasse pas 200 mots. Résume ce rapport trimestriel
en identifiant les 3 points clés.

# Bon — contrainte à la fin, mieux respectée

Résume ce rapport trimestriel en identifiant les 3 points clés.
Contrainte stricte : ta réponse ne doit pas dépasser 200 mots.

Évitez les instructions négatives larges

« Ne déduis rien » ou « ne fais aucune supposition » paralyse le modèle. Gemini 3 l’interprète trop littéralement et refuse ensuite de faire des calculs simples ou de synthétiser des informations évidentes. Préférez une formulation positive : « Base tes réponses uniquement sur les données fournies. Si une information manque, indique-le explicitement. »

La température : gardez-la à 1.0

Contrairement à ce qu’on pouvait faire sur les modèles précédents, Google recommande explicitement de laisser Gemini 3 à sa température par défaut (1.0). Le modèle a été optimisé pour ce réglage. Baisser la température en dessous de 1.0 peut provoquer des bouclages, des comportements inattendus et une dégradation des performances sur les tâches de raisonnement complexe. Si vous migrez depuis un code qui fixait explicitement temperature=0.2 ou temperature=0, retirez le paramètre plutôt que de l’ajuster.

Le persona colle fort

Quand vous assignez un persona à Gemini (via un Gem ou une instruction système), le modèle y adhère très fortement. Google prévient : le modèle peut ignorer certaines de vos instructions ultérieures si elles contredisent le persona défini. C’est un atout (cohérence du personnage) et un piège (difficulté à « sortir du rôle »). L’exemple officiel de persona cadré :

# Persona strict — exemple officiel Google

Tu es un extracteur de données.
Tu as l'interdiction de clarifier, d'expliquer ou de
développer des termes. Renvoie uniquement les données
demandées au format spécifié.

Thought Signatures (API)

Pour les développeurs qui appellent l’API Gemini sur plusieurs tours, Gemini 3 utilise des Thought Signatures : des représentations cryptées du raisonnement interne du modèle. Pour maintenir la qualité du raisonnement entre appels, vous devez renvoyer ces signatures exactement telles que reçues. L’API applique une validation stricte sur le tour courant. Point à connaître si vous construisez un agent multi-tour ou un workflow de function calling.

Structurer ses prompts pour la grande fenêtre de contexte

La fenêtre de 1 million de tokens de Gemini est un avantage technique — mais elle ne garantit pas que le modèle lira tout avec la même attention. Plus le contexte est long, plus les tokens pertinents risquent de se perdre parmi les tokens non pertinents. Google documente une règle claire pour contrer ce phénomène.

Règle officielle : données d’abord, question à la fin

Quand vous travaillez avec un contexte long (livre, base de code, vidéo longue), placez toutes les données d’abord, puis vos instructions et votre question à la fin. C’est l’inverse de ce qu’on pourrait croire instinctivement. Pour faire la transition entre le bloc de données et la question, Google recommande une phrase d’ancrage explicite du type « Based on the information above… » (ou son équivalent français « En te basant uniquement sur les informations ci-dessus… »).

Séparez instructions et données avec des balises

Ne mélangez jamais vos consignes avec le contenu à analyser. Utilisez des séparateurs explicites. Les balises XML-like fonctionnent très bien sur Gemini 3. Règle importante : ne mélangez pas XML et Markdown dans le même prompt — choisissez un format et tenez-vous-y.

# Structure avec séparateurs — données d'abord, question à la fin

<document>
[coller le contrat ici]
</document>

<instructions>
Tu es un juriste spécialisé en droit du travail français.
Analyse le document ci-dessus et identifie les clauses
qui pourraient être contestées devant les prud'hommes.
Pour chaque clause problématique, cite l'article du Code
du travail concerné.
</instructions>

<format_sortie>
Tableau : Clause | Page | Risque | Article du Code du travail
Suivi d'un paragraphe de recommandation par clause.
Contrainte finale : ne traite que les clauses effectivement
problématiques. Si le contrat est conforme, dis-le.
</format_sortie>

En te basant uniquement sur les informations ci-dessus,
produis l'analyse demandée.

Demandez une vérification de lecture

Avant de lancer l’analyse d’un document long, demandez à Gemini de résumer ce qu’il a compris du document en trois phrases. Si le résumé est correct, enchaînez avec votre vraie question. Si le résumé est faux, le document n’a pas été bien ingéré — il vaut mieux le recharger ou le segmenter.

Prompts courts ou détaillés : la règle Gemini 3

C’est la différence la plus contre-intuitive pour qui vient des modèles précédents ou d’autres assistants. Sur Gemini 2.x, on s’est habitué à des prompts longs, pleins de garde-fous, avec une décomposition étape par étape et des listes de contraintes explicites. Sur Gemini 3, cette approche est contre-productive.

Google est explicite dans sa documentation : Gemini 3 est meilleur pour extraire une structure à partir d’un indice léger, tenir une instruction en une seule phrase, et conserver des contraintes sur plusieurs tours de conversation. La règle pratique qui en découle :

Commencez par un prompt court — une phrase pour l’objectif, une phrase pour le format de sortie. Stop.
Ajoutez des contraintes seulement si la sortie dérive — une par une, pas toutes d’un coup.
Ne répétez pas les contraintes à chaque tour dans une conversation multi-tours. Gemini 3 les conserve mieux que ses prédécesseurs.
Retirez les étapes explicites (« d’abord fais A, ensuite B, puis C ») — utilisez thinking_level: high à la place.
Retirez les règles JSON évidentes — « renvoie un JSON valide » suffit, pas besoin de préciser « pas de virgules traînantes, utilise des guillemets doubles ».

# Prompt Gemini 2.x (overkill sur Gemini 3)

D'abord, lis le document en entier. Ensuite, identifie
les thèmes clés. Puis, extrais les citations pertinentes.
Enfin, synthétise le tout. Assure-toi de ne pas halluciner,
de ne pas inventer de citations, de rester factuel.
Renvoie un JSON valide avec des guillemets doubles,
sans virgules traînantes, avec les clés "themes" et "quotes".

# Prompt Gemini 3 équivalent (court, efficace)

Extrais les thèmes clés du document avec les citations
qui les appuient. Renvoie en JSON.

Le second prompt donne généralement un meilleur résultat sur Gemini 3 — avec moins de tokens consommés. Si la sortie n’est pas satisfaisante, ajoutez UNE contrainte à la fois et retestez.

Cinq prompts Gemini prêts à copier

Ces prompts exploitent les spécificités de Gemini 3 — multimodal, grand contexte, Gems, thinking levels. Ils sont pensés pour fonctionner directement dans l’app ou via l’API.

# 1. Analyse vidéo avec timestamps

Regarde cette vidéo de formation interne (uploadée).
Pour chaque changement de sujet, note le timestamp
et résume le point clé en une phrase.
À la fin, identifie les 3 moments où le formateur dit
quelque chose qui contredit la documentation officielle
que je t'ai envoyée hier dans ce notebook.

# 2. Comparaison de 5 documents longs

Voici 5 contrats de fournisseurs (uploadés).
Construis un tableau comparatif avec ces colonnes :
- Durée d'engagement
- Clause de résiliation anticipée
- Pénalités de retard
- Plafond de responsabilité
- Exclusivité (oui/non)
Indique le numéro de page pour chaque donnée.
Si une clause est absente d'un contrat, écris "absent".

# 3. Gem pour la veille concurrentielle quotidienne

[À coller dans les instructions d'un Gem]
Tu es mon analyste concurrentiel.
Chaque matin, je te donne 2-3 URLs d'articles.
Pour chaque article, produis :
- Entreprise concernée
- Fait nouveau (1 phrase)
- Impact potentiel sur notre marché (1 phrase)
- Action recommandée : ignorer / surveiller / réagir
Format : tableau, pas de prose.

# 4. Debug multimodal

[Upload : capture d'écran d'une erreur + fichier de log]
Voici une capture d'écran de l'erreur et le fichier de log.
1. Lis l'erreur dans la capture.
2. Cherche cette erreur dans le fichier de log.
3. Identifie la ligne exacte qui a déclenché l'erreur.
4. Propose un correctif avec le code modifié.

# 5. Recherche dans vos propres données (Notebook + Gem)

[Gem connecté à un Notebook contenant jusqu'à 300 sources]
Dans mes sources, que disent les études publiées après 2024
sur l'effet du jeûne intermittent sur la masse musculaire
chez les plus de 50 ans ?
Cite chaque source avec son titre et la page.
Si les études se contredisent, présente les deux positions.

Ce que vous devez retenir — et la suite

Prompt engineering Gemini 3 n’est pas prompt engineering Gemini 2.x, et encore moins prompt engineering générique. Les règles clés à graver : prompts courts par défaut, contraintes négatives à la fin, température à 1.0, chain-of-thought remplacé par thinking_level: high, persona pris très au sérieux, données avant question sur contextes longs, XML OU Markdown (pas les deux), Thought Signatures à renvoyer telles quelles sur l’API.

Deux réflexes à adopter immédiatement : créez un Gem pour votre tâche la plus fréquente (le temps investi se rentabilise dès la troisième utilisation), et commencez toujours par un prompt court — ajoutez des contraintes seulement si la sortie dérive. L’inverse de l’intuition des modèles précédents.

Dans le prochain article, on passe à la pratique avec Gemini dans Gmail : trier, résumer, rédiger. Comment le panneau latéral transforme la gestion de votre boîte mail, comment Personal Intelligence prépare automatiquement vos réunions, et quelles sont les limites réelles de l’assistant email de Google.

Chapitre suivant

Gemini dans Gmail : trier, résumer, rédiger

Vous maîtrisez maintenant le prompting Gemini 3. Le chapitre suivant montre comment le panneau latéral Gemini dans Gmail accélère le tri d’inbox, génère des réponses dans votre ton et retrouve n’importe quelle pièce jointe en quelques secondes.

Gemini dans Gmail ↗

Mise à jour : 24 avril 2026