Le flou autour des données d’entraînement de l’IA ravive le débat sur les droits d’auteur
L’absence de résumés clairs sur les données utilisées pour entraîner les modèles d’intelligence artificielle relance le bras de fer entre les entreprises technologiques et les représentants des secteurs culturels. Plusieurs organisations de créateurs dénoncent le manque de transparence des acteurs de l’IA, alors même que le droit européen impose des obligations en la matière.
Ces critiques interviennent après qu’Euractiv a révélé que plusieurs modèles d’IA parmi les plus utilisés ne fournissaient pas les informations requises sur leurs données d’entraînement.
En vertu de la loi européenne sur l’IA (AI Act), les entreprises qui publient des modèles d’IA de base à grande échelle doivent divulguer des informations sur leurs données d’entraînement, depuis août dernier dans certains cas, et en théorie. Dans la pratique, la Commission ne commencera à appliquer cette règle qu’en août prochain, laissant aux entreprises spécialisées dans l’IA une marge de manœuvre d’un an pour se mettre en conformité.
Quentin Deschandelliers, de la Fédération des éditeurs européens, a déclaré à Euractiv que le refus des entreprises spécialisées dans l’IA de divulguer leurs données d’entraînement empêchait les titulaires de droits d’être rémunérés pour leur travail et de faire valoir leurs droits.
Mais les groupes de créatifs avec lesquels nous nous sommes entretenus ont également fait valoir que, même si l’obtention des informations requises par la loi européenne sur l’IA constituerait une avancée positive, cela ne suffirait pas à garantir la protection de leur propriété intellectuelle.
Burak Özgen, du Groupement européen des sociétés d’auteurs et compositeurs, a déclaré que le niveau de transparence exigé des entreprises d’IA était encore « très, très loin » de ce qu’il considérait comme suffisant.
Les géants de l’IA encore loin des exigences de transparence de l’UE
En vertu du règlement européen sur l’IA (AI Act), les entreprises qui développent des modèles…
7 minutes
Où en est l’UE ?
Ces plaintes ne sont pas nouvelles : les titulaires de droits se sont insurgés l’été dernier, lorsque la Commission a précisé les informations que les entreprises d’IA seraient tenues de fournir en vertu de la loi. Mais ils sont d’autant plus indignés que les entreprises d’IA ne se sont pas encore conformées à cette obligation et que l’exécutif européen reste muet sur la question.
« La Commission devrait être beaucoup plus proactive dans l’application de la loi », a déclaré Quentin Deschandelliers, en référence à la loi sur l’IA et, plus généralement, aux règles de l’UE en matière de droits d’auteur.
Laetitia Nguala Masamba, secrétaire générale de European Visual Artists, a également déclaré à Euractiv que la Commission devrait améliorer le modèle de données d’entraînement afin que les auteurs puissent vérifier de manière exhaustive si leurs œuvres sont utilisées.
« De plus, le respect de la législation européenne doit être garanti, en vérifiant que les résumés sont exacts et véridiques », a-t-elle ajouté.
Au-delà de la volonté de garantir la transparence totale des entreprises d’IA, les titulaires de droits envisagent la possibilité d’une réforme plus large des règles de l’UE en matière de droits d’auteur.
Les législateurs de la commission des affaires juridiques du Parlement voteront la semaine prochaine sur un rapport rédigé par Axel Voss, du Parti populaire européen (PPE), qui souhaite mettre en place un mécanisme permettant aux entreprises d’IA de rémunérer les personnes dont elles exploitent le contenu.
À moyen terme, une révision de la directive européenne sur le droit d’auteur, que la Commission pourrait publier d’ici juin, est également prévue.