Inutile de parler des IA génératives, considéré comme un « domaine du deep learning qui donne aux machines la capacité de générer du contenu (image, vidéo, texte, etc.), à partir de données crées manuellement » (Qu’est-ce que l’intelligence artificielle générative ? – La revue IA), et du plus célèbre d’entre elles, Chat GPT. Inutile même de parler des enjeux et des dangers de ces logiciels d’un genre nouveau. Ces questions ont été maintes fois traitées.
Ici, la parole est donnée au principal accusé.
- Les IA génératives, un péril pour les auteurs ?
Question : Les IA génératives sont-elles un danger pour les auteurs ?
« L’impact des intelligences artificielles génératives sur les auteurs est un sujet débattu et complexe », notamment en matière de « créativité concurrente : Les IA génératives peuvent produire du contenu de manière autonome, mais la question de savoir si cela représente une menace directe pour la créativité humaine est débattue », en matière de « démocratisation de la création : Les IA génératives pourraient également être considérées comme des outils qui démocratisent la création artistique en permettant à un plus grand nombre de personnes d’exprimer leur créativité, même sans une expertise artistique approfondie », sur « des questions éthiques », en matière « de propriété intellectuelle » et pose de « nouveaux défis pour le marché de l’art : L’émergence d’œuvres génératives pose des défis potentiels pour le marché de l’art traditionnel, notamment en ce qui concerne la valorisation des œuvres, la reconnaissance de l’auteur et la perception de la valeur artistique ».
Ainsi, « l’impact des IA génératives dépendra largement de la manière dont ces technologies sont utilisées et réglementées. Les débats actuels portent sur la nécessité d’adapter les lois existantes sur la propriété intellectuelle pour refléter ces nouvelles réalités. […] Le « danger » potentiel pour les auteurs réside davantage dans la manière dont les utilisateurs choisissent d’utiliser ces technologies plutôt que dans la nature intrinsèque du modèle lui-même. Les utilisateurs doivent faire preuve de responsabilité et prendre en compte les implications éthiques et légales lorsqu’ils utilisent des contenus générés par des modèles de langage ».
Dès lors, pour cette première question, le programme de OpenAI, bien qu’il aime à me rappeler qu’il n’est « qu’un outil qui génère du texte en fonction de données sur lesquelles [il a] été formé » et qu’il n’a « pas d’intentions, de motivations ou d’effets propres », soulève cependant de nombreuses questions
- L’atteinte au droit d’auteur
Question : Violes-tu les droits d’auteur en récoltant les données nécessaires pour t’entraîner ?
Chat GPT : « Non, je ne viole pas les droits d’auteur. L’entraînement du modèle, y compris la collecte de données, a été réalisé en respectant les droits d’auteur et en se conformant à des pratiques éthiques. Les données utilisées pour mon entraînement proviennent de sources diverses, telles que des livres, des articles et des pages web, et ont été traitées conformément aux droits et aux licences applicables. »
Question : Certes, mais les auteurs qui t’ont inspiré ne t’ont pas donné l’autorisation d’utiliser leurs oeuvres. Ne s’agirait-il donc pas d’une violation du droit d’auteur ?
Chat GPT : « Mon entraînement a été réalisé sur un vaste ensemble de données provenant de sources diverses, et l’utilisation de ces données est conforme aux lois sur le droit d’auteur. Les textes utilisés pour mon entraînement sont généralement des extraits courts, et la manière dont les données sont utilisées est conforme aux principes du fair use (usage équitable) et des licences d’utilisation appropriées.
Cependant, il est important de noter que je ne reproduis pas littéralement des œuvres spécifiques et ne suis pas en mesure de fournir des extraits de textes protégés par le droit d’auteur sur demande. Mon objectif est de générer des réponses et du contenu de manière créative et originale, sans reproduire de manière substantielle des œuvres spécifiques. »
Chat GPT, en reprenant des notions juridiques françaises voire européennes telle que le critère d’originalité, ou des principes américains comme le fair use démontre la volonté de Chat GPT d’informer que son entraînement est conforme aux différents régimes juridiques internationaux. Il s’agit donc d’une manière de se prémunir face aux litiges futurs du fait d’une violation du droit d’auteur ou du copyright en fonction du régime juridique ?
- Les données personnelles des utilisateurs
Question : Stockes-tu les données personnelles des utilisateurs de sorte à fournir des réponses personnalisées pour chacun d’entre eux ?
Chat GPT : « Je ne stocke pas de données personnelles provenant des utilisateurs qui interagissent avec moi. Mes réponses sont générées en temps réel et ne sont pas basées sur des données spécifiques d’une personne à l’autre. Les utilisateurs doivent toutefois faire preuve de prudence lorsqu’ils partagent des informations sensibles en ligne et respecter les droits d’auteur lorsqu’ils utilisent des contenus générés par des modèles de langage. »
Que dire donc en conclusion ? Eh bien, qu’en matière de droit d’auteur, Chat GPT semble se réfugier derrière certaines exceptions légales pour justifier ses entraînements sur des œuvres de l’esprit ou autres données. En disant que « ses entraînements sont généralement effectués sur « des extraits courts » d’œuvres de l’esprit, il m’informe que ses entraînements, pour sa société-mère Open AI, sont effectués conformément à l’exception de citation prévu à l’article 122-5 du Code de propriété intellectuelle qui empêche l’auteur d’interdire la représentation ou la reproduction d’extraits de son œuvre à des fins professionnelles ou éducatives notamment. Cependant, pour que cette exception soit retenue, il faut que la citation soit brève, qu’elle ait une vocation essentiellement pédagogique et non commerciale et que l’auteur soit cité. Or, ici, la vocation est commerciale et l’identité du ou des auteurs ayant inspirés les réponses de Chat GPT à une question d’un utilisateur ne sont jamais dévoilés.
Doit-on ainsi considéré qu’il s’agit d’un abus de l’exception de citation de la part d’Open AI, ou la nécessité de voir le droit d’auteur évoluer pour se confronter à un monde évoluant ? Je serais tenté de répondre les deux à la fois.