Aller au contenu
Accueil » Blog » Kling, le modèle de génération vidéo qui défie les limites

Kling, le modèle de génération vidéo qui défie les limites

    L’intelligence artificielle a connu une avancée remarquable ces dernières années, repoussant constamment les frontières de ce qui est possible.
    Dans ce paysage en constante évolution, une entreprise chinoise, Kuaishou, a récemment fait parler d’elle avec le lancement de Kling.
    Ce modèle de génération vidéo semble en mesure de rivaliser avec les solutions les plus avancées du marché.
    Alors que le modèle Sora d’OpenAI peine encore à se concrétiser, Kling se démarque avec des performances impressionnantes, promettant de bouleverser l’industrie audiovisuelle.

    Kuaishou, un acteur majeur du social video en Chine

    Kuaishou n’est pas un inconnu dans le domaine du numérique.
    Fondée en 2011, cette entreprise s’est d’abord fait connaître pour sa plateforme de partage de vidéos courtes, devenant le second réseau social le plus populaire en Chine derrière TikTok.
    Avec une offre de contenus diversifiée, allant des vidéos de divertissement aux tutoriels en passant par les défis viraux, Kuaishou a su s’imposer comme une alternative de choix à la domination de TikTok sur le marché chinois.

    La stratégie IA ambitieuse de Kuaishou

    Parallèlement à son activité de réseau social, Kuaishou a entrepris ces dernières années de se positionner sur le marché de l’intelligence artificielle.
    En 2023, l’entreprise a présenté sa famille de modèles de langage de grande taille, KwaiYii, ainsi qu’un modèle texte-image baptisé Kolors.

    Kling, le dernier né de Kuaishou, s’inscrit dans cette dynamique d’innovation, venant challenger les acteurs établis du domaine de la génération vidéo.
    Et avec quelles démos il impressionne le monde entier.

    Les caractéristiques impressionnantes de Kling

    Kling se distingue par des performances techniques remarquables.

    Le modèle est capable de générer des vidéos allant jusqu’à 2 minutes de long, avec une résolution 1080p et 30 images par seconde.
    Il surpasse ainsi les capacités de son concurrent Sora, limité à une durée maximale d’une minute.

    De plus, grâce à une stratégie d’entraînement à résolution variable, Kling peut s’adapter à divers formats d’image.
    Il offre ainsi une flexibilité appréciable pour les professionnels de l’audiovisuel.

    Une architecture technique sophistiquée

    Sous le capot, Kling s’appuie sur une architecture de pointe.

    Utilisant un mécanisme d’attention spatio-temporelle 3D, le modèle est en mesure de mieux appréhender les mouvements complexes et les interactions physiques.
    Cela améliore ainsi la cohérence et le réalisme des séquences vidéo générées.

    De plus, les équipes de Kuaishou ont développé en interne une technologie de reconstruction 3D du visage et du corps humain.
    Cela permet d’animer finement les personnages à partir d’une simple image.

    Une qualité visuelle convaincante

    Les exemples de vidéos présentés par Kuaishou démontrent les capacités impressionnantes de Kling.
    Que ce soit le gros plan sur les plumes d’un perroquet bleu, le lapin lunettes sur le nez lisant un journal dans un café ou encore le travelling en haute résolution dans un paysage ferroviaire, les résultats obtenus sont d’une qualité visuelle convaincante.
    Le modèle semble maîtriser avec brio la gestion des repères physiques et la cohérence des séquences, se rapprochant ou dépassant les performances de Sora.

    Un concurrent de taille pour Sora et VEO

    Avec Kling, Kuaishou se positionne en sérieux concurrent face aux modèles de génération vidéo développés par OpenAI (Sora) et Google (VEO).
    Alors que ces derniers peinent encore à se concrétiser, Kling est déjà accessible au public.
    Notons toutefois qu’il est accessible avec quelques limitations techniques liées à son intégration dans l’application mobile Kling.

    Une disponibilité encore restreinte

    Actuellement, l’accès à Kling est limité aux utilisateurs chinois disposant d’un numéro de téléphone local.
    Kuaishou n’a pas encore communiqué sur une éventuelle ouverture du modèle à un marché international, ni sur les conditions d’utilisation des vidéos générées.
    Cependant, l’entreprise affiche ses ambitions dans le domaine de l’IA.
    On peut donc s’attendre à ce que Kling soit prochainement accessible à un public plus large, via une application dédiée ou une API pour les développeurs.

    Des enjeux de réglementation à surveiller

    Il convient également de noter que Kuaishou entretient des liens étroits avec les autorités chinoises.
    L’entreprise est notamment détenue en partie par le China Internet Investment Fund, une société d’État contrôlée par l’Administration du cyberespace de Chine.
    Certains attendent donc d’en savoir plus quant à la réglementation et à la sécurité des données.

    L’impact potentiel de Kling sur l’industrie audiovisuelle

    Au-delà des performances techniques, l’arrivée de Kling sur le marché pourrait avoir des répercussions significatives sur l’industrie du cinéma et de l’audiovisuel.
    Comme l’a souligné l’investisseur Ashton Kutcher, les modèles de génération vidéo comme Kling et Sora ont le potentiel de transformer radicalement la production de contenu dans l’entertainment.

    La révolution du contenu généré par l’IA

    Grâce à leur capacité à créer des séquences vidéo réalistes et cohérentes à partir de simples descriptions textuelles, ces modèles d’IA ouvrent la voie à de nouvelles possibilités en matière de création de contenu audiovisuel.
    Les réalisateurs, producteurs et autres professionnels du secteur pourront désormais s’appuyer sur ces outils pour accélérer et diversifier leur production.
    Ils réduiront aussi les coûts et les contraintes liés aux tournages traditionnels.

    L’essor des courts métrages générés par l’IA

    Un exemple concret de l’impact potentiel de Kling se trouve dans la projection prochaine des « Sora Shorts » au Tribeca Film Festival.
    Cette série de courts métrages, créés avec l’aide du modèle d’OpenAI, témoigne de l’intérêt grandissant des cinéastes pour ces technologies de génération vidéo.
    On peut imaginer que Kling, avec ses performances supérieures, suscitera également l’engouement des professionnels du septième art.
    Cela ouvrira aussi la voie à de nouvelles formes d’expression audiovisuelle.

    Kling, un modèle qui bouscule les codes

    Ainsi, avec Kling, Kuaishou a réussi à concevoir un modèle de génération vidéo qui rivalise, voire surpasse, les solutions les plus avancées du marché.
    Ses capacités techniques impressionnantes, sa flexibilité et la qualité visuelle de ses productions en font un concurrent sérieux face à Sora et VEO.
    Bien que son accessibilité soit encore limitée, Kling annonce déjà une transformation profonde de l’industrie audiovisuelle, offrant aux créateurs de nouveaux outils pour repousser les limites de la création.

    Plus d’infos sur l’IA

    L’intelligence artificielle a connu une avancée remarquable ces dernières années, repoussant constamment les frontières de ce qui est possible.
    Dans ce paysage en constante évolution, retrouvez les derniers outils et infos à connaître.

    Étiquettes: