Fugu de Sakana AI : le modèle japonais qui orchestre les autres modèles

Le 22 juin 2026, la start-up tokyoïte Sakana AI a dévoilé Fugu, un système qui se présente comme un modèle unique alors qu’il coordonne en coulisses plusieurs IA de pointe. La promesse : rivaliser avec Claude Fable 5 et Mythos Preview sans toucher à ces modèles sous contrôle export. Les premiers tests racontent une histoire plus nuancée, et la France est concernée par un détail qui change tout.

Posez une question de code complexe à Fugu : vous interrogez une seule API, vous recevez une seule réponse. En interne, le système a décidé tout seul s’il pouvait répondre directement, s’il devait appeler un modèle expert, ou s’il fallait faire travailler plusieurs agents en parallèle avant de fusionner leurs résultats. C’est exactement ce que Sakana AI vend avec Fugu : la simplicité d’un modèle unique, la puissance d’une équipe.

Lancé le 22 juin 2026, Fugu prend la course à l’IA générative à contre-pied. Là où OpenAI, Anthropic ou Google entraînent des modèles toujours plus gros, Sakana AI livre un chef d’orchestre. L’approche soulève autant d’enthousiasme que de scepticisme, et mérite qu’on dépasse les chiffres d’annonce.

Ce qu’est Fugu : un orchestrateur, pas un modèle de plus

Le système se décline en deux variantes lancées ensemble. La première, baptisée Fugu, vise l’usage quotidien sensible à la latence, avec des temps de réponse courts. Ensuite, Fugu Ultra (identifiant fugu-ultra-20260615) cible les tâches complexes en plusieurs étapes, où la profondeur de la réponse prime sur la vitesse. Les deux passent par une seule API compatible avec le format Chat Completions d’OpenAI, ainsi un outil existant se branche en changeant une simple URL.

Le cœur du système, c’est un orchestrateur appris. Sakana AI n’a pas codé un routeur à base de règles figées : l’entreprise a entraîné un modèle de langage à coordonner d’autres modèles, à déléguer le travail, à vérifier les sorties et à synthétiser une réponse finale. Cette politique de coordination s’appuie sur ses travaux de recherche baptisés Trinity et Conductor, et sur un coordinateur de LLM optimisé par évolution présenté à la conférence ICLR 2026.

Le pool de modèles que Fugu sollicite est constitué d’IA de pointe publiquement accessibles. Sa composition exacte reste partiellement divulguée, avec un mélange de modèles fermés et ouverts. Pour une requête donnée, Fugu Ultra route le travail vers un à trois agents, puis combine leurs résultats. Le système peut s’appeler lui-même de façon récursive pour creuser un problème difficile.

La distinction qui compte

Fugu n’est ni un modèle de fondation unique, ni un simple aiguilleur « si A alors B ». C’est un orchestrateur entraîné, à mi-chemin : plus intelligent qu’un routeur codé à la main, sans être un modèle monolithique de plus. Cette nature hybride explique à la fois sa qualité de sortie, son coût et la difficulté à auditer ses décisions.

Comment fonctionne l’orchestration de Fugu

Derrière l’API unique, chaque requête traverse une chaîne de décisions que le développeur n’a plus à construire lui-même. Jusqu’ici, exploiter plusieurs modèles imposait d’assembler ses propres routeurs, ses vérificateurs et ses garde-fous. Fugu prétend masquer toute cette plomberie.

Étape 01

Analyse et sélection

Fugu évalue la difficulté de la demande, alors il choisit de répondre seul ou de mobiliser des modèles experts du pool.

Étape 02

Délégation et exécution

Le travail part vers un à trois agents, en parallèle ou en séquence. Un modèle peut planifier, un autre exécuter, un troisième vérifier.

Étape 03

Vérification et synthèse

Fugu contrôle les sorties, puis fusionne les contributions en une réponse unique renvoyée par l’API.

Cette mécanique colle à l’ADN de Sakana AI, qui défend depuis ses débuts une approche inspirée du vivant : intelligence collective et composition de modèles plutôt que course brute à la taille. Fugu Ultra accepte un effort de raisonnement configurable, l’appel d’outils et une recherche web intégrée. Enfin, les jetons consommés par l’orchestration elle-même sont facturés comme des jetons d’entrée et de sortie standards, un point à garder en tête pour le budget.

Ce que disent vraiment les benchmarks

La revendication phare de Sakana AI tient en une phrase : Fugu Ultra égalerait Claude Fable 5 et Mythos Preview sur les tests d’ingénierie, de science et de raisonnement, sans accès à ces modèles soumis au contrôle export américain. Sur SWE-Bench Pro, un test de résolution de tâches de génie logiciel, les chiffres annoncés placent Fugu Ultra en tête face aux modèles grand public.

Modèle	SWE-Bench Pro	Type
Fugu Ultra	73,7 %	Orchestrateur
Claude Opus 4.8	69,2 %	Modèle unique
GPT-5.5	58,6 %	Modèle unique
Gemini 3.1 Pro	54,2 %	Modèle unique

Le score de 73,7 % est solide. Il appelle deux réserves sérieuses. La première : Claude Fable 5 atteint 80,0 % sur ce même test, et ce modèle ne fait même pas partie du pool de Fugu : la fameuse ligne « à parité avec Fable 5 » mérite alors un astérisque. Ensuite, Fugu Ultra ne mène pas partout. Sur la recherche d’information dans de longs documents, il reste derrière, ce qui concerne directement les équipes dont l’usage principal consiste à extraire des faits précis de gros corpus plutôt qu’à raisonner ou coder.

À lire avec prudence

Tous les chiffres publiés proviennent de Sakana AI et n’ont pas encore été reproduits par des laboratoires tiers indépendants. Des observateurs notent également que les comparaisons mélangent parfois des protocoles d’évaluation différents, et que le pool de Fugu inclut un mix non divulgué de modèles ouverts et fermés. Traitez ces résultats comme des indications de direction, à confronter à vos propres tâches réelles.

Tarifs, accès, et la question de la disponibilité en France

Fugu est accessible depuis la console de Sakana AI, à l’adresse console.sakana.ai, via l’API compatible OpenAI. Les deux modèles sont inclus dans chaque formule. Trois abonnements coexistent avec un mode de facturation à l’usage.

Formule	Prix	Usage cible
Standard	20 $/mois	Appels API occasionnels et expérimentation personnelle
Pro	100 $/mois	10× le quota Standard, sessions régulières de code et de recherche
Max	200 $/mois	30× le quota Standard, charges lourdes et longues
Paiement à l’usage	À la consommation	Facturation au jeton plutôt qu’au forfait mensuel

En paiement à l’usage, Fugu Ultra se facture 5 $ par million de jetons en entrée, 30 $ par million en sortie, et 0,50 $ par million de jetons d’entrée en cache. La fenêtre de contexte monte à 1 million de jetons, avec une sortie maximale de 128 000 jetons. Ensuite, les tarifs standards s’appliquent jusqu’à 272 000 jetons ; au-delà, les prix grimpent. Enfin, une mise en cache des invites peut réduire le coût effectif de 60 à 80 % sur les contextes répétés.

Indisponible dans l’Union européenne

Au lancement, Fugu est bloqué dans l’UE et l’EEE, le temps que Sakana AI finalise sa mise en conformité. Pour les développeurs et les entreprises basés en France, le service n’est alors pas accessible directement aujourd’hui. Vérifiez la prise en charge de votre région avant toute intégration.

Les limites réelles à connaître avant d’adopter Fugu

L’effet d’annonce passé, plusieurs frictions ressortent des premiers retours. La latence est la plus visible : Fugu Ultra échange du temps de réponse contre une coordination plus profonde, alors le délai varie fortement d’une requête à l’autre. Des adopteurs précoces rapportent des attentes allant jusqu’à 30 minutes sur les tâches lourdes, et un épuisement rapide du quota sur la formule d’entrée à 20 $.

Routing opaque — les décisions internes de Fugu fonctionnent comme une boîte noire. Vous ne voyez pas le graphe d’agents comme dans une orchestration que vous auriez construite vous-même, ce qui complique les usages sensibles à l’audit et à la conformité.
Latence imprévisible — sur des appels simples en un seul tour, la couche d’orchestration devient un surcoût pur sans bénéfice. Fugu Ultra n’a d’intérêt que sur les tâches multi-étapes réellement complexes.
Service propriétaire — le service d’orchestration hébergé n’est pas en open source. Sakana AI publie un dépôt GitHub avec des éléments de configuration et un rapport technique, alors que le comportement exact de l’orchestration reste fermé.
Dépendance à un fournisseur — confier le routage à un acteur unique expose aux pannes, aux changements de politique et aux restrictions d’accès de cet acteur.

Sakana AI, la signature derrière Fugu

Fondée à Tokyo mi-2023, Sakana AI tire son nom du mot japonais sakana, le poisson, en référence au banc de poissons : des individus dispersés qui forment une entité cohérente. L’entreprise compte parmi ses cofondateurs Llion Jones, l’un des auteurs du papier fondateur sur les Transformers, l’architecture qui sous-tend la quasi-totalité des grands modèles actuels. Son fil rouge : l’évolution, l’intelligence collective et la fusion de modèles open source plutôt que l’entraînement massif d’un mastodonte unique.

Fugu n’est pas le seul lancement récent de la maison. Une semaine plus tôt, Sakana AI a présenté Marlin, un agent de recherche autonome capable de tourner jusqu’à huit heures pour produire des rapports stratégiques de 100 pages. Les deux outils répondent à des usages distincts : Marlin pour la recherche profonde asynchrone, Fugu pour l’interaction immédiate. Sakana AI fournit également une commande d’installation en une ligne pour intégrer Fugu directement dans Codex.

Le positionnement souveraineté, vendu comme un moyen d’accéder à des performances de pointe sans dépendre d’un service américain sous contrôle export, doit être relativisé. Son pool inclut justement des modèles américains. La valeur concrète se situe ailleurs : un point d’accès unique qui contourne les pannes et les coupures d’un fournisseur donné.

Notre avis sur Fugu

Fugu industrialise une idée qui circule depuis des mois : composer une équipe d’agents spécialisés plutôt que demander à un modèle unique de tout savoir faire. L’exécution est sérieuse et l’orchestrateur appris dépasse le simple emballage. La proposition reste à confirmer sur trois fronts.

Le cas d’usage le plus solide concerne les équipes qui font déjà tourner des flux agentiques de longue haleine et qui maintiennent leur propre couche d’orchestration au-dessus de plusieurs modèles. Pour elles, Fugu Ultra mérite une évaluation sérieuse. Si vous cherchez une faible latence, un coût prévisible ou une gouvernance auditable, attendez, ou orchestrez vous-même avec une couche que vous contrôlez. Pour les professionnels et les entreprises en France, la question ne se pose même pas encore : le service est bloqué dans l’UE au lancement. Enfin, la bonne démarche consiste à décider sur la base de votre charge de travail réelle, alors que les chiffres d’annonce ne suffisent jamais à eux seuls.

Aller plus loin

Suivez l’actualité des modèles IA

Lancements, benchmarks et analyses sans complaisance : retrouvez toute la veille sur les grands modèles dans notre rubrique dédiée.

Voir la veille IA ↗

Mise à jour : 28 juin 2026