Google Flow : studio créatif IA image, vidéo et audio

Google Flow : studio créatif IA image, vidéo et audio
Google Flow : studio créatif IA image, vidéo et audio
Google Flow : studio créatif IA image, vidéo et audio
Google Flow : studio créatif IA image, vidéo et audio

Google Flow permet de créer des images, des vidéos et des compositions visuelles complètes à partir de descriptions textuelles ou d’images de référence. Accessible entièrement dans le navigateur, sans installation, la plateforme cible aussi bien les créateurs indépendants que les équipes marketing ou les cinéastes. Développé par Google DeepMind dans le cadre de Google Labs, ce studio unifié rassemble la génération d’images, de vidéo et d’audio — trois capacités auparavant dispersées entre Whisk, ImageFX et Veo.

 

Découvrir Google Flow

Google a lancé Flow lors de la conférence I/O 2025, d’abord comme outil de création vidéo centré sur Veo 3. Le 25 février 2026, une refonte majeure a tout changé : Whisk (moodboard et remixage visuel), ImageFX (images texte-vers-image) et Veo (génération vidéo) ont fusionné en une interface unique. Whisk a définitivement fermé le 30 avril 2026. Toutes ses fonctionnalités vivent désormais dans Flow. Depuis son lancement, la plateforme a généré plus de 1,5 milliard d’images et de vidéos, selon Google.

En pratique, Flow fonctionne comme un studio créatif complet. Sur la grille d’accueil, l’utilisateur crée un projet, génère des images avec Nano Banana 2, les affine avec les outils d’édition intégrés, puis les transforme en vidéo via Veo 3.1 — sans quitter l’application. Plus de 140 pays ont accès à la plateforme avec un abonnement Google AI Pro ou Ultra. Un accès gratuit limité existe également, avec 50 crédits quotidiens.

 

Fonctionnalités clés

Génération d’images avec Nano Banana 2

Nano Banana 2 (techniquement Gemini 3.1 Flash Image) est le moteur d’images par défaut de Flow depuis février 2026. Il génère des visuels de 512 px jusqu’en 4K, dans tous les formats (paysage, portrait, carré). Sa cohérence est notable : jusqu’à 5 personnages reconnaissables et 14 objets fidèles dans un même workflow. Concrètement, un personnage créé dans une première image conserve le même visage et la même tenue dans les suivantes — essentiel pour le storyboarding ou le branding. Aucun crédit n’est consommé pour la génération d’images dans Flow. Autre atout : le rendu de texte lisible dans les visuels (affiches, infographies, maquettes) et l’accès aux connaissances du web en temps réel via Google Search.

 

Création vidéo avec Veo 3.1

Veo 3.1 est le modèle vidéo de Google DeepMind au coeur de Flow. Il génère des clips de 4 à 8 secondes en 720p ou 1080p, avec upscaling 4K pour les abonnés Ultra. Le point de départ peut être un texte ou une image de référence. Sa particularité majeure est l’audio natif : sons d’ambiance, dialogues et effets sonores sont produits directement dans le clip, sans post-production séparée. Par exemple, un prompt décrivant « une femme marchant sous la pluie en parlant au téléphone » génère la vidéo, le bruit des gouttes, les pas et la voix en une seule passe. Côté crédits, comptez 10 unités par clip Veo 3.1 Fast, davantage en mode Quality. Depuis mai 2026, un modèle Veo 3.1 Lite permet des générations à zéro crédit, avec priorité réduite et qualité légèrement inférieure — pratique pour l’expérimentation rapide.

 

 

Workflow visuel unifié et édition

Flow propose un pipeline créatif continu qui élimine les allers-retours entre applications. Le parcours type suit cette logique : construire un moodboard visuel en glissant des images de référence, générer des keyframes avec Nano Banana 2, puis les animer en vidéo via Veo 3.1. Grâce à l’outil lasso, l’utilisateur édite localement une image par simple description textuelle (remplacer un objet, modifier un arrière-plan). Des contrôles cinématiques offrent la maîtrise des mouvements de caméra : panoramique, zoom, travelling. La fonction « Extend » prolonge un clip pour explorer la suite d’une scène. Côté organisation, les assets sont regroupables dans des « Collections », et un système de référencement par « @ » permet d’invoquer rapidement un fichier dans un nouveau prompt.

 

Ingredients et cohérence narrative

La fonction « Ingredients » assure la cohérence visuelle à travers plusieurs générations. Son principe : verrouiller le visage, la tenue et le style d’un personnage, puis le réutiliser dans des scènes différentes. Contrairement à un simple copier-coller, le modèle traite le personnage comme un « acteur » et l’adapte naturellement à chaque contexte (éclairage, angle, action). Cette approche facilite la production de courts-métrages ou de storyboards publicitaires où un même personnage doit apparaître sur 10 ou 20 plans. Seuls les abonnés Pro et Ultra y ont accès.

 

Flow TV et apprentissage par l’exemple

Flow TV est une galerie intégrée de clips réalisés par d’autres utilisateurs. Chaque création affiche le prompt exact et les réglages utilisés. L’intérêt est pédagogique : au lieu de deviner la bonne formulation, on explore des centaines de créations réussies et on adapte les prompts à ses propres projets. Plusieurs cinéastes professionnels y contribuent, dont Dave Clark (« Battalion », « NinjaPunk ») et Henry Daubrez (« Kitsune », « Electric Pin ») — des exemples de qualité cinématographique réelle.

 

Cas d’usage

Créateurs de contenus vidéo : Flow accélère la production de courts-métrages, de reels Instagram et de vidéos TikTok. Un créateur solo peut produire un clip narratif de 30 secondes (4-5 plans) en une à deux heures, moodboard compris. L’audio natif évite le recours à un logiciel de montage son séparé. Pour une chaîne YouTube de vulgarisation, la plateforme génère des séquences d’illustration (reconstitution historique, visualisation scientifique) impossibles à filmer autrement.

Équipes marketing et agences : la création de maquettes vidéo pour des pitchs clients passe de plusieurs jours à quelques heures. Avec Ingredients, la cohérence du personnage de marque reste intacte à travers une série de posts. Une agence peut ainsi prototyper 5 concepts créatifs pour une campagne avant de choisir lequel produire en réel. Côté images, les visuels publicitaires (bannières, thumbnails, posts) sont gratuits via Nano Banana 2.

Enseignants et formateurs : Flow produit des vidéos explicatives et des séquences pédagogiques sans matériel de tournage. Un professeur de sciences peut ainsi générer une animation de processus biologique. De son côté, un formateur en histoire reconstitue une scène du passé en quelques minutes. Le prompting en langage naturel rend l’outil accessible sans compétence technique.

Musiciens et artistes visuels : la branche Flow Music (avril 2026, basée sur Lyria 3) ajoute la composition musicale et la création de vidéoclips synchronisés. Un musicien indépendant produit ainsi un clip complet — vidéo, musique et son — depuis une seule interface. Les artistes visuels, eux, exploitent Nano Banana 2 pour l’idéation rapide et le prototypage de concepts.

E-commerçants et entrepreneurs : Flow génère des visuels produit, des bannières et des vidéos de démonstration courtes. Un entrepreneur solo crée ses propres assets marketing sans photographe ni vidéaste, avec une qualité suffisante pour le web et les réseaux sociaux.

 

Tarifs

L’accès gratuit offre 50 crédits IA par jour (non cumulables) et 100 crédits de bienvenue. Cela suffit pour quelques générations vidéo quotidiennes et des images illimitées via Nano Banana 2. Le plan Google AI Pro à 19,99 $/mois inclut 1 000 crédits mensuels, soit 50 à 100 vidéos Veo 3.1 Fast selon la complexité. Ensuite, le plan Google AI Ultra à 249,99 $/mois fournit 25 000 crédits, la résolution 1080p native et l’upscaling 4K. Enfin, des crédits supplémentaires (top-up) sont achetables pour les abonnés Pro et Ultra, valables 12 mois. Les crédits mensuels non utilisés ne se reportent pas.

 

Analyse des points forts et limites

Points forts

  • Workspace tout-en-un : image, vidéo, audio et édition dans une seule interface. Le passage du moodboard à la vidéo finalisée se fait sans changer d’application.
  • Images gratuites en 4K : Nano Banana 2 fonctionne sans crédits dans Flow. Face à Midjourney, DALL-E ou Adobe Firefly qui facturent chaque image, l’avantage est direct.
  • Audio natif en vidéo : Veo 3.1 génère dialogues, sons d’ambiance et effets sonores dans le clip. En mai 2026, cette capacité reste rare parmi les générateurs vidéo IA.
  • Cohérence des personnages : Ingredients et Nano Banana 2 maintiennent jusqu’à 5 personnages cohérents. La plupart des concurrents ne gèrent pas cette continuité nativement.
  • Écosystème Google : intégration Workspace, publication YouTube annoncée pour fin 2026, crédits partagés entre Flow et les autres services Google AI.

 

Limites

  • Durée des clips limitée : chaque génération produit 8 secondes maximum. Pour 30 secondes de vidéo, il faut enchaîner 4 générations et gérer la continuité manuellement.
  • Crédits vidéo vite épuisés : avec le plan Pro (1 000 crédits/mois), un usage intensif atteint la limite en quelques jours. Le passage à Ultra (249,99 $/mois) reste brutal pour un créateur individuel.
  • Pas de travail collaboratif : en mai 2026, aucune collaboration en temps réel n’est disponible. Les équipes doivent se partager les exports manuellement.
  • Disponibilité géographique inégale : certains pays européens et asiatiques n’ont pas accès à Flow. Les utilisateurs concernés ont perdu Whisk le 30 avril 2026 sans solution de migration.
  • Absence d’API et d’automatisation : Flow reste un outil interactif dans le navigateur. Pour intégrer la vidéo dans un pipeline automatisé, il faut passer par l’API Veo via Vertex AI ou Gemini API.

 

Notre recommandation

Google Flow est le studio créatif IA le plus complet disponible gratuitement en mai 2026. Sa force : l’intégration verticale image, vidéo et audio dans un même workspace, avec un modèle d’images gratuit (Nano Banana 2) rivalisant avec les solutions payantes. Pour un créateur vidéo, un marketeur ou un formateur produisant régulièrement des visuels et des clips courts, le gain de temps est considérable. La limite principale reste économique : dès que le volume de vidéos dépasse quelques dizaines par mois, le coût grimpe vite. Les clips de 8 secondes contraindront également les professionnels de la vidéo longue. Face à Runway Gen-3 (montage plus granulaire), Midjourney (diversité stylistique) ou Kling (clips plus longs), Flow gagne sur la simplicité et le prix d’entrée, mais concède du terrain sur la flexibilité. Pour la génération d’images seule, Nano Banana 2 rivalise avec les meilleurs — et sa gratuité dans Flow suffit à justifier l’essai.

Mise à jour : 11 mai 2026