Attention : OpenAI et le danger insoupçonné du copyright!

High-Tech
11 janvier 2024

Contenus protégés par copyright cruciaux pour l'IA - OpenAI

La révolution de l’intelligence artificielle (IA) dans de nombreux domaines suscite des interrogations particulières en ce qui concerne l’utilisation des données pour l’entraînement des modèles. Les créateurs de contenu, éditeurs et artistes, qui survivent grâce aux droits d’auteur, se montrent de plus en plus préoccupés. Cette problématique a même donné lieu à des litiges juridiques, notamment celui entamé par le New York Times contre OpenAI.

Sommaire Afficher

Le rôle essentiel des données protégées par le droit d’auteur pour l’IA

OpenAI souligne avec insistance l’importance des contenus protégés par le droit d’auteur dans le développement de systèmes d’IA avancés. Malgré les controverses, l’entité clarifie sa position, prônant une collaboration étroite avec les entreprises et les gouvernements pour encadrer cette question épineuse. Cependant, la firme reconnaît ouvertement qu’il serait inenvisageable de concevoir des modèles d’IA sans exploiter de telles données. Cette admission n’a pas été formulée dans le cadre du litige avec le NY Times, mais en réponse à une enquête du Communications and Digital Committee du Royaume-Uni interrogeant les risques et opportunités des Large Language Models (LLM).

L’IA et l’avenir selon OpenAI

La perspective d’OpenAI quant à l’avenir de l’IA est optimiste. L’organisation envisage que ces technologies apportent une contribution significative à la société dans divers domaines, et prévoit des LLM toujours plus performants. Si des risques existent, OpenAI affirme mettre tout en œuvre pour les minimiser. Elle plaide pour l’adoption de lois régulant le secteur afin d’assurer un développement sécurisé de l’IA.

La portée du copyright et la formation des modèles d’IA

OpenAI explique qu’il est impossible d’entraîner des modèles de pointe sans inclure des matériaux protégés par le droit d’auteur, qui englobent une vaste gamme d’expressions humaines telles que les articles de blog, les photographies, les posts de forum, les fragments de code logiciel et les documents administratifs. Quant aux contenus du domaine public, la société suggère que se restreindre à ceux datant d’il y a plus d’un siècle constituerait un test intéressant, mais insuffisant pour répondre aux besoins actuels.

L’exploitation conforme aux lois et l’éthique de l’IA

Sur le plan technique, OpenAI défend que son action est légale, précisant que les lois en vigueur ne prohibent pas l’utilisation des contenus protégés pour l’entraînement des modèles d’IA. Toutefois, l’entité reconnaît qu’il est nécessaire d’intensifier les efforts pour soutenir les détenteurs de droits d’auteur. En conséquence, des instruments ont été mis en place pour les webmasters et créateurs afin que leurs contenus ne soient plus employés pour les nouvelles sessions d’apprentissage des modèles.

La gestion des données préalablement utilisées

La question qui persiste concerne la gestion des données déjà exploitées. Bien que les lois actuelles soient jugées inadaptées pour traiter ces problématiques, OpenAI est sommée de trouver des solutions pour régulariser l’usage de ces données, étant donné que c’est grâce à elles que l’entreprise a pu progresser jusqu’à ce jour.

La complexité et l’évolution continue des technologies d’IA rappellent d’autres thématiques tout aussi préoccupantes. Par exemple, sur les problématiques de partialité de l’IA. Prenant en compte les nuances de cette discussion, il est possible de faire le parallèle avec un cas récemment mis en lumière dans une étude de la réaction des chatbots à des situations d’intelligence artificielle, illustrant ainsi l’impact potentiel en termes de biais et d’éthique.

Droit d’auteur et innovation : vers un équilibre

Les débats actuels autour du copyright et de l’intelligence artificielle montrent clairement que la balance entre l’innovation technologique et le respect des droits de propriété intellectuelle est un défi d’envergure. Si l’adoption de nouvelles réglementations est envisagée, elles devront inéluctablement concilier le besoin de données pour nourrir l’intelligence artificielle et la légitimité des préoccupations des créateurs de contenu.

Derniers articles

Calculateur de budget PC

Trouvez la configuration idéale selon votre budget et usage

Quel est votre budget ?

1000€

Utilisation principale ?

💾 Configuration recommandée

Budget estimé

Prix indicatifs basés sur le marché actuel. Les tarifs peuvent varier selon les revendeurs et promotions.

💡 Astuce : Privilégiez un bon processeur et carte graphique pour le gaming, la RAM pour la productivité.