Le datamining, prochaine exception au droit d’auteur ?

Les éditeurs britanniques s’opposent à cette préconisation du rapport Hargreaves, l’occasion de reprendre les aspects juridiques du datamining que nous avions déjà explorés. La question n’est pas anodine pour cette technique amenée à avoir le vent en poupe dans la recherche universitaire et qui, pour se développer, doit bénéficier d’un cadre juridique adapté.

Une exception au droit d’auteur permettant aux chercheurs de faire à des fins non commerciales du textmining ou du datamining (englobés sous le concept de Content mining), consistant  à balayer des corpus et à en extraire des informations pour les analyser, c’est que préconisait, en mai 2011, le rapport Hargreaves dans ses recommandations faites pour réformer le droit de la propriété intellectuelle au Royaume-Uni.

La directive européenne sur le droit d’auteur et les droits voisins ne s’y oppose pas. Elle permet à chaque Etat membre d’opter pour une exception au droit d’auteur autorisant « une utilisation à des fins exclusives d’illustration dans le cadre de la recherche scientifique, sous réserve d’indiquer, à moins que cela ne s’avère impossible, la source, y compris le nom de l’auteur, dans la mesure justifiée par le but non commercial poursuivi ».

Encore faut-il adapter cette disposition aux activités de Content mining dans le droit national ! Or, si en vertu du Fair dealing, les chercheurs britanniques peuvent copier, sans autorisation, des parties d’une œuvre, ce régime ne répond pas à toutes les attentes et les établissements négocient des licences lorsque des copies multiples ou d’autres usages sont nécessaires. En France,  l’exception « à des fins d’illustration dans le cadre de l’enseignement et de la recherche » (art. 122-5 du Code de la propriété intellectuelle), issue de cette directive, qui se traduit aujourd’hui uniquement par une série d’accords sectoriels, ne couvre pas non plus les activités de Content mining.

Pour accéder à des corpus d’œuvres protégées par le droit d’auteur ou, en l’absence de droit d’auteur, par le droit des bases de données, et pour utiliser ces corpus les chercheurs (et leurs établissements) doivent négocier des licences.

Non à l’exception

Les éditeurs britanniques s’opposent à l’idée d’une exception au droit d’auteur qui, en leur faisant perdre la maîtrise du système, leur fait courir de multiples risques.

-          Des risques techniques

Et de citer l’engorgement de la bande passante ou la fragilisation de la sécurité du système informatique. Les licences, en revanche, leur permettent de garder la main et, à défaut d’éviter tout problème technique, ils pourront engager plus facilement la responsabilité des « mineurs » si un problème de sécurité devait découler des pratiques de recherches, et les établissements faisant du Content mining à des fins non commerciales seraient plus enclins à encadrer celles-ci.

-          Des risques commerciaux

En accordant des licences, les éditeurs gardent le contrôle, notamment la maîtrise du concept non commercial avancé par les chercheurs, alors qu’une exception serait la porte ouverte à toutes les dérives.

En outre, en raison des risques commerciaux et techniques qu’elle implique, une exception au droit d’auteur handicaperait l’édition britannique face à la concurrence de pays où le Content mining n’est pas une exception, et la mettrait en péril.

  • Exception au droit d’auteur et test des trois étapes. Le Content mining est appelé à se développer et la valeur d’usage se trouver dans les données et les métadonnées élaborées pour donner du sens et non plus dans reproduction et la représentation de l’oeuvre. Cette pratique pourrait remplacer la lecture humaine et devenir à terme le mode d’exploitation normal de l’œuvre au grand dam du test de trois étapes, si le Content mining devait représenter une exception. Selon ce test, en effet, une exception au droit d’auteur ne peut être exercée que lorsqu’elle représente un cas spécial, qu’elle ne porte pas atteinte à l’exploitation normale de l’œuvre et ne cause pas de préjudice à l’auteur. On peut gager toutefois que la lecture traditionnelle a encore un bel avenir et que cet argument juridique, s’opposant à l’exception, peinera à être retenu !  

Oui aux licences

Puisqu’un Content mining libre pourrait menacer le modèle économique des éditeurs et qu’il convient de garder la main par des licences, la solution consisterait-elle à améliorer les licences, jugées aujourd’hui trop strictes, mais aussi, paradoxalement, trop vagues ? C’est ce que avancent les éditeurs britanniques.

Les éditeurs européens seraient d’ailleurs déjà enclins à accorder des licences pour les usages non commerciaux. En outre, certains établissements universitaires parviendraient à gérer la complexité des licences due aussi à la complexité des techniques employées et à la diversité des corpus utilisés. Suffirait-il alors de diffuser ces bonnes pratiques ? Sera-t-on autorisé à communiquer publiquement ces contrats ? On peut en douter.

Mais  ….

L’exception au droit d’auteur, un handicap ?

Le Japon et  certains pays scandinaves auraient déjà adopté une telle exception et celle-ci pourrait être étendue par une volonté européenne à tous les pays de l’Union européenne, comme le préconise le rapport Hargreaves. Pourquoi ne pas établir alors de comparaisons entre les pays ayant adopté une telle exception et ceux où les activités de Content mining sont encadrées par des licences ? Ceci permettrait d’évaluer l’impact de tel ou tel système.

Les points faibles des licences

Dans le projet de Règlement Google Livres, que j’avais pris à titre d’exemple en juillet 2011, seuls les utilisateurs accrédités par Google  auraient été autorisés à explorer le corpus par des techniques de datamining pour des recherches qui, entreprises à des fins non commerciales, ne devaient pas concurrencer l’un des services de Google.

Or, le datamining et toutes les techniques de veille exploitant les données figurant dans des corpus représentent un service que les éditeurs entendent développer eux-mêmes et monnayer pour obtenir un retour sur investissement, le besoin de reproduire et de représenter une œuvre allant décroissant.

Dans ce même projet de Règlement, il était affirmé que seul le gestionnaire de la base de données contenant les copies numériques des livres (soit Google et lui seul) est habilité à autoriser les analyses et les recherches sur son corpus. Cette clause pose des problèmes d’impartialité, notamment dans le domaine toujours sensible de la recherche scientifique, sans compter les risques liés à la confidentialité des recherches.

Que faire aussi, en sachant que Google peut retirer des informations, et qu’aucune garantie n’est donnée sur l’exhaustivité et la fiabilité du corpus ? Quelle parade utiliser pour garantir un accès dans de bonnes conditions à une base de données jugée essentielle pour lesquelles les éditeurs auraient forcément le monopole des contenus ?

Se placer sur un autre champ ?

La licence obligatoire liée à la théorie des facilités essentielles dans le champ du droit de la concurrence, qui rééquilibre les droits du titulaire des droits intellectuels et l’intérêt collectif du marché » et qui, sans répondre à toutes les questions, donne quelques ouvertures.

Trouver un équilibre entre les objectifs de la recherche (et son indépendance) et les modèles économiques des éditeurs et les licences accordées, tel est l’enjeu. Si, comme le souligne le représentant de l’association des éditeurs britanniques, « the publishing sector is leading the field in driving innovation in products, services and delivery”, c’est peut-être aussi avec l’aide de la recherche publique, d’où l’occasion de démontrer « comment le droit d’auteur peut opérer pour le bénéfice de tous dans l’environnement numérique ».

A suivre …

Illustr. Comics + Information design. Austin Kleon. Flickr CC by-nc-nd

Mes sources

Alerte

Pour approfondir

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>