Mes lectures 0

Mes lectures

IA Générale

Google Lyria vs musiciens : vos uploads YouTube nourrissent-ils l’IA ?

Une plainte déposée par des musiciens indépendants accuse Google d'avoir utilisé leurs morceaux téléversés sur YouTube pour entraîner son modèle de générat

Salle d'audience vide au crépuscule avec une balance en laiton posée sur un banc de bois et la silhouette d'un greffier s'éloignant.
📋 En bref
Une plainte déposée par des musiciens indépendants accuse Google d'avoir utilisé leurs morceaux téléversés sur YouTube pour entraîner son modèle de générat
  • Ce qui change concrètement dans ce contentieux
  • Les faits : l'accusation et la défense de Google
  • Décryptage : l'usage des contenus pour entraîner Lyria
  • Qui est concerné par cette problématique

Une plainte déposée par des musiciens indépendants accuse Google d’avoir utilisé leurs morceaux téléversés sur YouTube pour entraîner son modèle de génération musicale Lyria 3. La firme tente de faire rejeter l’action en s’appuyant sur la licence accordée par les conditions d’utilisation de la plateforme. Elle refuse toutefois de confirmer si Lyria est bien entraîné sur ces contenus.

🤖 Transparence IA — Cet article a été rédigé avec l'assistance d'outils d'IA générative à partir de sources primaires identifiées, puis relu et validé par Mohamed Meguedmi, fondateur de LagazetteIA.

Points clés – Des musiciens indépendants poursuivent Google pour utilisation non autorisée de leurs œuvres téléversées sur YouTube dans l’entraînement du modèle Lyria 3. – Google a déposé une requête en rejet en invoquant la licence large accordée par les conditions d’utilisation de YouTube, sans confirmer ni démentir l’usage des vidéos pour Lyria. – La défense de la société se résume, selon The Verge, à : « vous ne pouvez pas prouver que nous l’avons fait, et même si nous l’avons fait, nous en avions le droit ». – Neal Mohan, directeur général de YouTube, avait reconnu en avril 2024 qu’une « certaine portion » des vidéos servait à l’entraînement de Gemini et Veo, sans citer Lyria. – L’affaire pose la question juridique centrale du périmètre exact de la licence d’usage consentie par les créateurs lors de l’upload.

Ce qui change concrètement dans ce contentieux

L’affaire portée devant la justice américaine ne se limite pas à un différend commercial entre quelques artistes et un géant de la tech. Elle interroge le statut juridique de tout fichier téléversé sur une plateforme grand public à l’ère des IA génératives. The Verge rapporte le 10 juin 2026 que Google répond à l’accusation en mobilisant ses conditions générales d’utilisation, sans jamais confirmer le fait reproché. Cette stratégie défensive trace une ligne nouvelle : la plateforme assume le droit d’usage sans documenter l’usage lui-même.

Les faits : l’accusation et la défense de Google

Selon The Verge, un groupe de musiciens indépendants poursuit Google en justice. Ils estiment que la société a utilisé leurs chansons téléversées sur YouTube pour entraîner Lyria 3, le modèle de génération musicale développé par DeepMind et intégré aux outils créatifs de YouTube. Les plaignants considèrent cet usage comme non autorisé et constitutif d’une violation de leurs droits sur les enregistrements concernés.

Google a déposé une requête (motion to dismiss, requête visant à faire rejeter l’action en l’état) pour mettre fin au procès avant même son examen sur le fond. La société articule deux lignes de défense. La première porte sur la preuve : l’allégation des musiciens, selon Google, ne démontre pas factuellement que Lyria 3 a été entraîné sur leurs morceaux spécifiques. La seconde porte sur le droit : à supposer même que ces morceaux aient servi à l’entraînement, les conditions d’utilisation de YouTube confèrent à Google une licence suffisante pour le faire.

C’est cette articulation que The Verge résume en une formule : « you can’t prove we did it, and even if we did, we’re allowed to. » La position est juridiquement classique — c’est une défense en deux temps souvent utilisée en common law — mais politiquement délicate. Elle revient à refuser la transparence sur le périmètre d’entraînement tout en revendiquant l’autorisation de l’utilisateur.

Interrogée par The Verge, Google a renvoyé à la formulation suivante : « we use content uploaded to YouTube to improve the product experience for creators and viewers across YouTube and Google, including through machine learning and AI applications. » Cette phrase confirme l’usage des contenus YouTube pour des applications d’apprentissage automatique en général. Elle ne dit rien, en revanche, du modèle Lyria 3 en particulier. Le terme « Lyria » est notamment absent de la réponse officielle transmise à la rédaction américaine.

Pour comprendre — la motion to dismiss

Dans le droit américain, une motion to dismiss permet à un défendeur de demander au juge de rejeter une action en estimant que, même si tous les faits allégués étaient vrais, ils ne suffiraient pas à fonder juridiquement la plainte. C’est une étape préliminaire : elle se joue sur le droit, pas sur les preuves.

Ce qui nous amène au cœur du débat : que dit, exactement, la licence YouTube ?

Décryptage : l’usage des contenus pour entraîner Lyria

Les conditions d’utilisation de YouTube accordent à la plateforme une licence large couvrant le droit de « reproduce, distribute, [and] prepare derivative works » à partir du contenu téléversé. Cette formulation, citée par The Verge, est centrale dans la défense de Google. Elle inclut le droit de réaliser des « œuvres dérivées », notion qui en droit d’auteur américain recouvre les adaptations, traductions et transformations d’une œuvre originale.

La question juridique est de savoir si l’entraînement d’un modèle d’IA générative constitue, ou non, la préparation d’une œuvre dérivée au sens où l’entendaient les rédacteurs des conditions générales. Le débat n’est pas tranché. Plusieurs procédures parallèles aux États-Unis interrogent le statut de l’entraînement IA au regard du droit d’auteur, sans jurisprudence consolidée à ce jour. Google fait le pari que ses conditions, rédigées en termes suffisamment larges, couvrent cet usage.

Le second élément du décryptage tient à l’asymétrie d’information. Google a publiquement reconnu, par la voix de son directeur général Neal Mohan en avril 2024, qu’une « certaine portion » des vidéos YouTube servait à entraîner Gemini, le modèle linguistique généraliste, ainsi que Veo, le générateur vidéo. Cette confirmation publique n’a jamais été étendue à Lyria 3. La société se contente de la formule générique « machine learning and AI applications », qui n’isole aucun produit en particulier.

Cette ambiguïté n’est pas innocente. Confirmer publiquement que Lyria 3 est entraîné sur des morceaux YouTube reviendrait à fournir aux plaignants un élément factuel qui leur manque actuellement. Inversement, démentir cet usage exposerait la société à un retournement procédural si une preuve contraire émergeait en phase de discovery (la procédure de communication forcée des éléments de preuve entre parties). Le silence, dans ce contexte, est une posture défensive cohérente.

La position défendue par Google revient finalement à dire : « si nous l’avons fait, c’était autorisé ; mais nous ne disons pas si nous l’avons fait. » Cette double posture transforme le contentieux en un test de la solidité juridique des conditions générales d’utilisation à l’ère de l’IA générative. Pour les créateurs, l’enjeu est majeur : ce sont les mêmes conditions, ou presque, qui régissent tous les uploads sur tous les services grand public — réseaux sociaux, plateformes de stockage, services de messagerie.

Ce qui nous conduit à examiner précisément qui se trouve, aujourd’hui, exposé à cette interprétation.

Qui est concerné par cette problématique

Trois catégories d’acteurs se trouvent directement impliqués par le contentieux Lyria.

Les créateurs de contenu musical. Au premier chef, les musiciens indépendants qui ont téléversé leurs morceaux sur YouTube sans imaginer qu’ils pourraient nourrir un modèle d’IA générative capable de produire des compositions concurrentes. Les plaignants se rangent dans cette catégorie. Mais la portée est plus large : tout artiste ayant publié un morceau sur YouTube, depuis la création de la plateforme, l’a fait sous des conditions d’utilisation qui — selon l’interprétation de Google — couvrent l’entraînement IA. Pour les ayants droit, la question n’est pas seulement de récupérer une indemnisation : c’est de fixer une jurisprudence sur le périmètre exact de la cession consentie au moment de l’upload.

Les développeurs et éditeurs de modèles d’IA générative. Au-delà de Google, tout acteur du secteur observe la stratégie défensive déployée ici. Si la requête en rejet est accueillie, elle créera un précédent permettant à d’autres plateformes d’invoquer leurs propres conditions générales pour neutraliser des actions similaires. Si elle est rejetée, le contentieux devra entrer en phase de discovery et exposera, potentiellement, le périmètre réel des données d’entraînement de Lyria 3.

YouTube et Google en tant que plateforme. L’entité est attaquée à un double titre. D’une part comme hébergeur des contenus litigieux. D’autre part comme bénéficiaire direct, via DeepMind, de l’entraînement contesté. Cette intégration verticale — héberger les œuvres et produire le modèle qui s’en nourrit — est exactement ce que les plaignants pointent comme problématique. Les autres grandes plateformes (Meta, TikTok, X) intègrent toutes, à des degrés divers, hébergement de contenus utilisateurs et développement de modèles génératifs.

Pour les créateurs européens, la question se pose dans des termes partiellement différents. Le règlement (UE) 2024/1689, dit AI Act, impose aux fournisseurs de modèles d’usage général de publier un résumé suffisamment détaillé des contenus utilisés pour l’entraînement. Cette obligation ne créera pas, à elle seule, un droit subjectif d’action. Mais elle pourrait fournir aux ayants droit FR une base documentaire que les plaignants américains ne possèdent pas.

Ce qui amène à l’analyse contradictoire des arguments en présence.

Analyse contradictoire : droit d’auteur vs conditions générales

Les plaignants défendent une lecture restrictive de la licence YouTube. Selon eux, l’autorisation accordée à la plateforme pour « reproduce, distribute, [and] prepare derivative works » concerne l’exploitation du contenu dans le cadre de YouTube — diffusion, recommandation, monétisation publicitaire — et non son injection dans un modèle d’IA générative externe au service. Cette interprétation s’appuie sur le principe d’interprétation stricte des cessions de droits, classique en droit d’auteur : ce qui n’est pas explicitement cédé reste à l’auteur.

L’argument est renforcé par le fait que les conditions d’utilisation de YouTube ont été rédigées et acceptées par les utilisateurs à une époque où l’entraînement de modèles génératifs n’était ni techniquement courant, ni commercialement saillant. Les ayants droit estiment qu’on ne peut pas, a posteriori, étendre la portée d’une cession à des usages que l’auteur n’avait aucune raison d’anticiper.

Google défend, à l’inverse, une lecture extensive et neutre du texte. La licence accordée couvre la préparation d’œuvres dérivées. L’entraînement d’un modèle est, techniquement, une opération de transformation statistique des œuvres. Rien dans la rédaction des conditions ne limite l’usage à un contexte technologique précis. À cela s’ajoute un argument de stabilité contractuelle : si chaque évolution technologique conduisait à renégocier de facto le périmètre des licences accordées, l’opérabilité des plateformes deviendrait impraticable.

Aucune position n’est, à ce stade, juridiquement intenable. Le juge devra arbitrer entre une interprétation littérale du contrat et une interprétation finaliste qui s’attache à l’intention raisonnable des parties au moment de la conclusion. Le résultat dépendra largement de la formulation exacte des conditions en vigueur à l’époque des uploads concernés et de la jurisprudence pertinente sur la portée des cessions standardisées.

FAQ : questions sur les droits des créateurs et l’IA

Est-ce que mon upload sur YouTube permet à Google d’utiliser ma musique pour entraîner son IA ?

Google n’a pas confirmé que Lyria 3 est entraîné sur des morceaux YouTube. La société a en revanche reconnu qu’une partie des vidéos servait à entraîner Gemini et Veo. Les conditions d’utilisation accordent une licence large incluant la préparation d’œuvres dérivées, dont la portée exacte sur l’entraînement IA reste à trancher par le juge.

Quels sont les arguments juridiques utilisés par Google pour se défendre ?

Google articule une défense en deux temps. D’abord, contester que la preuve de l’usage des morceaux des plaignants pour entraîner Lyria 3 soit factuellement établie. Ensuite, invoquer la licence large accordée par les conditions d’utilisation de YouTube, qui couvre selon la société la reproduction, la distribution et la préparation d’œuvres dérivées, y compris dans un contexte d’apprentissage automatique.

Le droit européen change-t-il la donne pour les créateurs français ?

L’AI Act impose aux fournisseurs de modèles d’usage général de publier un résumé suffisamment détaillé des données d’entraînement. Cette obligation de transparence pourrait fournir aux ayants droit FR une base documentaire absente du contentieux américain. Elle ne crée pas, à elle seule, un droit d’action sur des œuvres spécifiques, mais elle réduit l’asymétrie d’information actuelle.

Calendrier : prochaines étapes du litige

La phase actuelle est centrée sur l’examen de la requête en rejet déposée par Google. Si le juge accueille la requête, la procédure s’arrête au stade préliminaire. S’il la rejette, l’affaire entre en phase de discovery, durant laquelle les plaignants pourront exiger la communication d’éléments documentant le périmètre exact d’entraînement de Lyria 3. Reste une question ouverte : combien de procédures similaires faudra-t-il avant qu’une jurisprudence stable se dégage ?

En résumé – Google fait face à une plainte de musiciens indépendants alléguant l’usage non autorisé de leurs uploads YouTube pour entraîner Lyria 3. – La défense repose sur la licence large des conditions d’utilisation et sur l’absence de preuve directe de l’usage contesté. – La société n’a jamais confirmé ni démenti que Lyria 3 est entraîné sur des vidéos YouTube, contrairement à Gemini et Veo. – Le juge américain devra arbitrer entre interprétation stricte et extensive de la licence consentie à l’upload. – L’AI Act européen pourrait, par son obligation de transparence sur les données d’entraînement, réduire l’asymétrie d’information actuelle pour les créateurs FR.

Avatar photo
À propos de l'auteur

Mohamed Meguedmi

Je suis Mohamed Meguedmi, fondateur et directeur éditorial de LagazetteIA. Multi-entrepreneur passionné de tech depuis toujours, j'ai intégré l'IA dans chacune de mes entreprises dès ses débuts. Chaque semaine, je teste des dizaines d'outils IA, compare les modèles et décortique les dernières avancées pour vous donner un avis concret, sans bullshit. Mon objectif avec LagazetteIA : vous faire gagner du temps et vous aider à prendre les bonnes décisions dans cette révolution technologique. La rédaction s'appuie sur des outils d'analyse modernes (incluant l'IA générative) et chaque publication est vérifiée et validée par mes soins avant mise en ligne. Profil LinkedIn : https://www.linkedin.com/in/mohamed-meguedmi/