Aller au contenu
    LOCAL
    Guide IA — IA en local

    LM Studio : faire tourner une IA en local sans terminal

    Vous voulez essayer un modèle d’IA sur votre propre ordinateur, sans ligne de commande et sans envoyer vos données dans le cloud. LM Studio télécharge un modèle, le lance, et vous discutez avec lui dans une application classique. Voici comment l’installer, choisir le modèle adapté à votre machine, et aller jusqu’à brancher votre IA locale sur Claude Code.

    Téléchargez une application, cherchez un modèle dans un catalogue, cliquez sur « charger », et vous discutez avec une IA qui calcule entièrement sur votre ordinateur. C’est la promesse de LM Studio, et elle tient en moins de cinq minutes, sans une seule ligne de commande.

    L’IA locale a longtemps semblé réservée aux développeurs à l’aise avec le terminal. LM Studio a changé cette règle en posant une interface graphique sur des moteurs d’inférence comme llama.cpp. N’importe qui peut désormais installer un LLM, le faire tourner hors ligne et garder ses données sur sa machine. Si vous avez déjà testé un modèle directement dans votre navigateur, ce logiciel est l’étape juste au-dessus.

     

    À quoi sert LM Studio

    LM Studio est une application de bureau gratuite, éditée par Element Labs, qui télécharge, gère et exécute des modèles de langage open source en local. Elle fonctionne sur macOS, Windows et Linux. L’application n’est pas un modèle en soi : elle sert de cockpit pour des modèles ouverts que vous choisissez dans son catalogue, comme Llama, Mistral, Qwen, Gemma ou GPT-OSS.

    Le public visé est large. Le débutant complet y trouve une expérience proche d’un ChatGPT privé, sans configuration technique. Le développeur, lui, exploite le serveur d’API local pour brancher un modèle sur ses propres outils. Pour comprendre ce qu’un modèle local sait faire et ce qu’il faut éviter de lui demander, notre guide sur le fonctionnement des LLM pose les bases utiles.

    À retenir

    LM Studio réunit quatre fonctions dans une seule application : la recherche de modèles, l’estimation de la mémoire requise avant téléchargement, le chat, et un serveur d’API local. Tout s’exécute sur votre machine. Rien ne part vers un serveur externe pendant vos conversations.

     

    Installer LM Studio en cinq minutes

    La version stable au 13 juin 2026 est la 0.4.16. L’installation suit trois étapes, sans terminal du début à la fin.

    Étape 01
    Télécharger l’application

    Rendez-vous sur le site officiel et choisissez votre système : Mac Apple Silicon (DMG), Windows x86_64 ou ARM64 (EXE), Linux x86_64 ou ARM64 (AppImage ou DEB). L’installation est classique.

    Étape 02
    Découvrir un modèle

    Ouvrez l’onglet Discover, cherchez un modèle par nom ou par capacité. L’application affiche la mémoire estimée avant le téléchargement, ce qui évite de charger un modèle trop lourd pour votre machine.

    Étape 03
    Discuter avec le modèle

    Passez dans l’onglet Chat, chargez le modèle téléchargé, écrivez votre première question. Le modèle répond depuis votre ordinateur, et vous pouvez couper internet sans perdre la conversation.

    Pour un premier essai, un modèle de 7 à 8 milliards de paramètres comme Mistral ou Qwen 3.5 reste raisonnable sur une machine équipée de 16 Go de mémoire. Le débit réel dépend ensuite de votre matériel, sujet que nous détaillons plus bas.

     

    Choisir un modèle selon votre machine

    Le vrai filtre n’est pas le modèle, mais la mémoire disponible. L’estimation affichée dans l’onglet Discover vous indique si un modèle tiendra avant même de le télécharger. Sur PC, c’est la mémoire de la carte graphique (la VRAM) qui compte le plus ; sur Mac Apple Silicon, c’est la mémoire unifiée, partagée entre processeur et puce graphique.

    Cette différence a une conséquence directe. LM Studio embarque le moteur MLX, optimisé pour les puces Apple. Sur un Mac récent, ce moteur délivre un débit nettement supérieur à la voie classique, et sa version 1.8.5 introduit une mise en cache qui accélère les échanges longs avec un agent. Le catalogue couvre les modèles ouverts du moment : GPT-OSS, Qwen 3.5 et 3.6, Gemma 4, Llama, Mistral ou encore Nemotron 3 Super.

    Si vous hésitez sur la capacité de votre ordinateur, le moyen le plus simple reste de tester un petit modèle avant d’investir du temps sur un modèle ambitieux.

     

    Brancher LM Studio sur vos outils : l’API locale

    La fonction qui transforme LM Studio en brique technique, c’est son serveur d’API local. Une fois activé, il expose vos modèles sur localhost:1234, avec deux compatibilités : l’API au format OpenAI (/v1/chat/completions et /v1/responses) et l’API au format Anthropic (/v1/messages). Un code existant qui appelait un modèle cloud peut basculer vers votre modèle local en changeant une seule ligne : l’adresse du serveur.

    Le piège à éviter

    L’API locale est désactivée par défaut. Activez-la dans Settings > Server avant de tenter la moindre connexion, sinon vos requêtes échoueront sans raison apparente.

    Cette double compatibilité ouvre un usage concret pour qui connaît déjà l’écosystème Claude : LM Studio peut servir de moteur local à Claude Code grâce à l’endpoint au format Anthropic. Vous codez alors avec un modèle qui tourne chez vous, sans clé d’API ni facturation à l’usage.

    # 1. Activer le serveur : Settings > Server > Start
    # 2. Interroger le modèle (format OpenAI)
    curl http://localhost:1234/v1/chat/completions \
      -H "Content-Type: application/json" \
      -d '{"model":"qwen3.5","messages":[{"role":"user","content":"Bonjour"}]}'

    Pour aller plus loin, deux SDK officiels existent (lmstudio-js et lmstudio-python) ainsi qu’une interface en ligne de commande, lms. Et pour qui veut un véritable poste de travail IA auto-hébergé autour de ces modèles, la fiche Odysseus, un workspace IA auto-hébergé montre jusqu’où l’on peut pousser un environnement local complet.

     

    Locally et LM Link : votre IA locale depuis le mobile

    La nouveauté la plus marquante de juin 2026 concerne le mobile. LM Studio a racheté l’application Locally AI au printemps, puis a lancé LM Link, une fonction qui établit une connexion sécurisée entre votre téléphone et votre ordinateur. Vous pilotez ainsi, depuis un iPhone ou un iPad, les modèles qui tournent sur votre Mac ou votre PC resté à la maison.

    L’intérêt est direct : vos modèles les plus lourds restent sur la machine puissante, et vous y accédez en déplacement depuis un appareil léger. Depuis la version 0.4.16, LM Link ne réclame plus d’inscription préalable et se configure depuis l’application mobile Locally.

     

    LM Studio ou Ollama : lequel choisir

    Les deux outils s’appuient sur les mêmes moteurs d’inférence et offrent des performances comparables sur un modèle donné. La différence tient à l’expérience et à l’usage visé.

    Critère LM Studio Ollama
    Interface Graphique, zéro terminal Ligne de commande
    Public idéal Débutant, exploration visuelle Développeur, automatisation
    API locale localhost:1234 localhost:11434
    Apple Silicon Moteur MLX intégré MLX depuis la v0.19
    Maturité de l’API Solide, en évolution rapide Plus mature

    La règle est simple. Pour débuter sans terminal et explorer des modèles à la souris, LM Studio est le bon point de départ. Pour scripter, automatiser ou intégrer un modèle dans un workflow, Ollama devient plus naturel. Beaucoup d’utilisateurs finissent par garder les deux, chacun pour son terrain.

     

    Les limites à connaître avant de vous lancer

    • Votre machine fixe le plafond — un modèle local consomme mémoire et puissance graphique. Sur une configuration modeste, vous serez limité aux modèles légers, moins capables que les meilleurs modèles cloud.
    • Le moteur MLX est réservé à Apple Silicon — son gain de vitesse ne profite pas aux PC sous Windows ou Linux, qui passent par d’autres voies d’accélération.
    • La qualité varie selon le modèle — un modèle excelle en code, un autre en synthèse, un autre en français. Le seul vrai test reste votre usage réel.
    • L’API reste plus jeune que celle d’Ollama — pour un usage léger ou de l’expérimentation, elle convient ; pour un déploiement exigeant, Ollama garde une longueur d’avance en maturité.

    Ces limites tiennent surtout au matériel. Pour interroger vos propres documents en local sans rien envoyer dans le cloud, l’étape suivante logique passe par un système RAG, que LM Studio peut alimenter via son API.

     

    Notre avis sur LM Studio

    LM Studio est la meilleure porte d’entrée graphique vers l’IA locale en 2026. L’installation tient ses cinq minutes, l’estimation de mémoire avant téléchargement évite les déconvenues, et l’ajout de l’app mobile rend l’ensemble plus concret au quotidien. Pour un débutant qui veut juger l’IA locale sur pièces, c’est l’outil à installer en premier.

    Le parcours complet se dessine alors clairement : tester un modèle dans le navigateur pour valider le principe, installer LM Studio pour un usage sérieux à la souris, puis basculer vers Ollama le jour où vous voulez automatiser. Trois marches, de la curiosité à l’autonomie réelle.

    Aller plus loin
    Construire un assistant IA privé avec Ollama

    Une fois LM Studio en main, la série Ollama vous emmène vers l’API locale, l’automatisation et l’assistant personnel auto-hébergé.

    Passer à Ollama en local
    Mise à jour : 14 juin 2026