Aller au contenu
    GLM
    Guide IA · Série Z.ai 1/12

    Z.ai : le guide complet pour bien démarrer

    Le 8 avril 2026, Z.ai publie GLM-5.1 en open source sous licence MIT. Le modèle dépasse Claude Opus 4.6, GPT-5.4 et Gemini 3.1 Pro sur SWE-Bench Pro, et peut travailler seul pendant huit heures. Pour un tiers du prix d’un abonnement Claude Max, vous accédez aux mêmes capacités. Encore faut-il savoir par où entrer dans l’écosystème — chat, Coding Plan, API, agents. Ce premier guide vous rend opérationnel en quinze minutes.

    Ouvrez un onglet sur chat.z.ai. Vous tombez sur une interface de chat sobre, un bandeau en haut à droite, un champ de saisie en bas. Pas de tutoriel, pas de pop-up. Tapez votre question, choisissez un modèle, envoyez. En trois minutes, vous avez généré une présentation complète ou un prototype d’application web fonctionnelle — gratuitement, sans carte bancaire.

    C’est cette simplicité qui rend Z.ai déroutant au départ. L’outil ne vous guide pas. Il suppose que vous savez ce que vous voulez. Ce guide pose donc les quatre questions auxquelles il faut répondre pour démarrer correctement : qu’est-ce que Z.ai exactement, comment ouvrir un compte, quel modèle choisir, et quel plan payer (ou pas).

    Z.ai en une phrase : le laboratoire chinois derrière GLM

    Z.ai, c’est le nom international de Zhipu AI depuis le rebranding de 2025. L’entreprise est née en 2019 d’un spin-off de l’Université Tsinghua à Pékin. Elle est considérée comme le troisième acteur chinois des grands modèles de langage derrière Alibaba et Baidu, et s’est introduite en bourse à Hong Kong le 8 janvier 2026 sous le nom « Knowledge Atlas » (code HKEX 02513).

    Son produit phare s’appelle GLM (General Language Model). La série compte aujourd’hui une quinzaine de modèles, du minuscule GLM-4.5-Air au flagship GLM-5.1. Depuis juillet 2025, tous les modèles majeurs sortent sous licence MIT — vous pouvez les télécharger, les héberger chez vous et les utiliser commercialement sans contrainte. C’est l’un des rares laboratoires frontier à maintenir cette politique.

    Deux éléments distinguent Z.ai de la concurrence. D’abord, GLM-5 et GLM-5.1 ont été entraînés intégralement sur des puces Huawei Ascend, sans aucun GPU Nvidia — une prouesse technique qui répond aux restrictions américaines à l’exportation. Ensuite, Z.ai figure sur l’Entity List du Département du Commerce américain depuis janvier 2025, ce qui a des conséquences concrètes sur l’usage en entreprise européenne ou américaine (voir plus bas).

    L’écosystème Z.ai en cinq briques

    Quand on parle de « Z.ai », on parle en réalité de cinq produits distincts qui partagent les mêmes modèles mais s’adressent à des usages différents. Les confondre fait perdre du temps.

    Produit Pour qui Accès
    chat.z.ai Tout le monde, usage conversationnel Gratuit, compte Google
    GLM Coding Plan Développeurs dans Claude Code, Cursor, Cline 10 à 80 $/mois
    API Z.ai Développeurs qui intègrent GLM dans leurs apps Paiement à l’usage
    AutoGLM & AutoClaw Agents autonomes navigateur et desktop Extension Chrome, app locale
    Poids open source Entreprises qui auto-hébergent Hugging Face, licence MIT

    Pour ce guide, on se concentre sur les deux premières briques : chat.z.ai (pour découvrir) et le Coding Plan (pour les développeurs qui veulent remplacer ou compléter leur abonnement Claude). Les autres briques sont traitées dans les guides suivants de la série.

    Créer son compte et faire tourner son premier prompt

    L’inscription prend moins de deux minutes. Rendez-vous sur chat.z.ai. Cliquez sur « Sign in » en haut à droite. Deux options : compte Google ou adresse email classique. La connexion Google est la plus rapide — un clic, un choix de compte, c’est fait.

    L’interface est en anglais et en chinois. Pas de version française. Ce n’est pas bloquant : les modèles GLM comprennent parfaitement le français et répondent dans la langue de la requête. Vous pouvez écrire votre premier prompt directement en français, il sera traité sans dégradation de qualité.

    01
    Aller sur chat.z.ai et se connecter avec Google

    Aucune vérification téléphone, aucune carte bancaire. Le compte est actif immédiatement. L’accès fonctionne depuis l’Europe sans VPN.

    02
    Choisir un modèle dans le menu déroulant

    GLM-4.7 est le choix par défaut pour commencer. GLM-5.1 pour les tâches complexes. GLM-4.7-Flash pour les essais rapides — entièrement gratuit, aucun quota.

    03
    Taper un prompt et activer les outils

    Les trois icônes en bas du champ activent la recherche web, la lecture de documents et le mode vision. Tous sont inclus dans le plan gratuit avec un quota mensuel.

    Pour calibrer l’outil sur un usage réel, demandez-lui de générer une présentation : « Crée une présentation de 8 slides sur les tendances de l’IA générative en 2026. Public : dirigeants de PME. Ton : factuel. » GLM active automatiquement son agent Slide, construit le plan, récupère des données via recherche web, et vous renvoie un deck complet exportable en PPT ou PDF. Cette opération utilise le GLM Slide Agent, traité en détail dans l’article Z4 de la série.

    Choisir le bon modèle : GLM-5.1, 5-Turbo, 4.7 ou Flash

    Z.ai affiche une douzaine de modèles disponibles dans le sélecteur. Trois suffisent à couvrir 95 % des besoins. Les autres sont des variantes spécialisées (vision, OCR, reconnaissance vocale) qu’on traitera dans les articles dédiés.

    Modèle Pour quelles tâches Contexte Prix API (entrée/sortie par 1M tokens)
    GLM-5.1 Tâches longues, code complexe, agents 8h 203K 1,26 $ / 3,96 $
    GLM-5-Turbo Workflows agents multi-étapes, vitesse 203K 1,20 $ / 4,00 $
    GLM-4.7 Usage quotidien, rédaction, code standard 203K 0,39 $ / 1,75 $
    GLM-4.7-Flash Tests, complétions simples, prototypes 203K Gratuit

    GLM-5.1 est le modèle le plus puissant de la gamme. Publié le 7 avril 2026, il score 58,4 sur SWE-Bench Pro, battant Claude Opus 4.6 (57,3), GPT-5.4 (57,7) et Gemini 3.1 Pro. Sa vraie singularité : il maintient sa productivité sur des tâches de plusieurs heures — jusqu’à 1 700 étapes de réflexion et 6 000 appels d’outils dans une seule session. Les modèles antérieurs plafonnaient bien avant.

    GLM-5-Turbo est sa version accélérée, moins profonde mais plus rapide. Idéal pour des agents qui enchaînent de nombreuses actions courtes (automatisation, gestion de tickets, scraping structuré). GLM-4.7 correspond grosso modo au niveau de Claude Sonnet 4.5 — il fait 90 % du boulot pour 30 % du prix. GLM-4.7-Flash est la version gratuite, utile pour tester l’outil ou lancer des milliers d’appels peu exigeants.

    La règle de base pour économiser du quota

    GLM-5.1 et GLM-5-Turbo consomment 3× le quota standard en heures de pointe (14h-18h heure de Pékin, soit 8h-12h heure de Paris), et 2× en heures creuses. Jusqu’à fin avril 2026, Z.ai offre un bonus : 1× en heures creuses. Travailler l’après-midi et le soir en Europe revient donc à tripler sa capacité réelle, sans surcoût.

    Comprendre les plans : gratuit, Lite, Pro, Max

    Le plan gratuit de chat.z.ai est généreux : accès à GLM-4.7-Flash en illimité, accès rationné aux autres modèles, agents Slide et Poster inclus, trois MCP natifs (recherche web, lecture de pages, lecture de documents). Pour un usage conversationnel ponctuel, il suffit.

    Dès qu’on passe à un usage intensif ou qu’on veut brancher GLM sur un IDE comme Claude Code ou Cursor, il faut basculer sur le GLM Coding Plan. C’est l’abonnement phare de Z.ai, celui qui a bâti sa réputation en 2026 comme alternative économique à Claude Pro et Claude Max.

    Plan Prix Quota (fenêtre 5h) MCP web/mois
    Gratuit 0 $ Quota limité, GLM-4.7-Flash illimité Inclus, essai
    Lite ~10 $/mois (30 $/trim.) ~80 prompts 100 recherches
    Pro ~30 $/mois (90 $/trim.) ~400 prompts 1 000 recherches
    Max ~80 $/mois (240 $/trim.) ~1 600 prompts 4 000 recherches

    La facturation est trimestrielle depuis février 2026. Les prix promotionnels de 3 $/mois qui circulaient fin 2025 ont été supprimés. Chaque prompt permet en moyenne 15 à 20 appels de modèle en interne, ce qui fait un quota réel de plusieurs milliards de tokens par mois même sur le plan Lite.

    Pour situer par rapport à la concurrence : le plan Lite (10 $) offre environ 3× le quota de Claude Pro (20 $). Le plan Pro (30 $) dépasse les quotas de Cursor Pro. Le plan Max (80 $) est comparable à Claude Team sur un périmètre individuel.

    Ce que Z.ai ne fait pas encore bien

    Z.ai a des points faibles qu’il faut connaître avant de basculer tout son workflow dessus. Les passer sous silence serait malhonnête.

    La vitesse d’inférence est le point noir principal. GLM-5.1 tourne à environ 44 tokens/seconde, soit la moitié de GPT-5.4 et six fois moins que Grok 4.20 selon BridgeBench. Sur des tâches interactives en pair-programming, le décalage est perceptible. Sur des tâches agentiques longues où le modèle travaille seul, cela compte beaucoup moins.

    La stabilité infrastructure a fait grincer des dents en début 2026. Plusieurs utilisateurs ont signalé des dégradations de qualité ponctuelles et des limites hebdomadaires moins prévisibles que celles de Claude. Z.ai a introduit en février 2026 un quota hebdomadaire en plus du quota 5h, sans toujours bien le communiquer. Vérifiez le compteur dans votre tableau de bord avant de lancer une session longue.

    La conformité entreprise reste un sujet. Z.ai figure sur l’Entity List américaine depuis janvier 2025. Pour une startup européenne indépendante, ce n’est pas bloquant — l’interdiction concerne les exports américains vers Z.ai, pas l’usage de Z.ai en Europe. Mais pour une entreprise qui travaille avec des clients américains ou qui manipule des données sensibles, cette dépendance à une infrastructure chinoise peut poser un problème de gouvernance. L’option d’auto-hébergement des poids MIT devient alors pertinente — elle est traitée dans le Z12 de la série.

    Ce que cela change pour vous

    Pour commencer avec Z.ai cette semaine, trois étapes suffisent. Créez un compte sur chat.z.ai avec votre compte Google. Passez une heure à tester GLM-4.7 et GLM-5.1 sur vos cas d’usage réels — rédaction, synthèse, code, génération de slides. Si vous codez régulièrement, souscrivez au plan Lite (10 $/mois) et branchez-le sur votre IDE comme on le verra dans le Z9.

    Notre avis : Z.ai n’est pas un remplacement universel de Claude ou ChatGPT. Ses modèles sont excellents sur le code et les tâches agentiques longues, corrects sur la rédaction et la recherche, un peu faibles sur les nuances culturelles occidentales. La stratégie qui fonctionne en 2026 : garder un compte Claude Pro pour les tâches critiques, ajouter un GLM Coding Lite pour les développements en volume. Trente dollars par mois pour deux outils qui couvrent tout le spectre.

    Les onze articles qui suivent cette série vous emmènent étape par étape du compte que vous venez de créer jusqu’aux agents autonomes qui travaillent huit heures sans supervision. Le prochain guide détaille précisément quand utiliser quel modèle GLM, avec un tableau de décision par cas d’usage.

    Aller plus loin
    La série complète pour maîtriser Z.ai

    Douze guides progressifs, des premiers prompts aux agents autonomes : tout l’écosystème Z.ai décortiqué pour les francophones.

    Explorer les guides IA
    Mise à jour : avril 2026
    Étiquettes: