Les enjeux de la numérisation du patrimoine en quelques mots-clés


La polémique autour du Règlement Google Livres, l’utilisation des fonds de l’emprunt national et l’essor que semble prendre vraiment cette fois-ci le livre numérique font de la numérisation du patrimoine culturel l’une des priorités du moment[1]. Sur cette question, thème d’un cycle de conférences organisé par la Bibliothèque nationale de France et plusieurs universités, voici l’angle adopté pour résumer en quelques mots-clefs la journée du 8 janvier 2010 [2].

Polysémie

Il y a effectivement souvent confusion dans les termes que l’on emploie. Lorsque l’on parle de numérisation, par exemple, il peut s’agir d’œuvres que l’on a numérisées, d’œuvres nées numériques ou de catalogues numérisés. L’accès à l’information, autre exemple évoqué, ne se traduit pas forcément par réappropriation ou démocratisation. Quant à l’accès libre, le domaine public, l’oeuvre libre de droits, il s’agit de concepts aux implications juridiques  différentes[3]. Il convient donc de se méfier des termes employés et de vérifier ce qu’ils recouvrent.

Dichotomie

Google ne serait qu’un réservoir de données où l’information est abondante et diverse, et les bibliothèques numériques ne proposeraient qu’un contenu réduit car filtré par des experts. Google répond à des intérêts privés dictés par des actionnaires et les bibliothèques à l’intérêt public. A Google donc la charge de numériser rapidement et à grande échelle, ce qui est son point fort, et aux bibliothèques de s’en servir pour construire des  bibliothèques numériques. Mais cette dichotomie est trop réductrice. On sait, par exemple, depuis octobre 2010, que Google, simple régie publicitaire au départ, entend devenir libraire en ligne, occupant ainsi une partie de chaîne du livre qu’il n’avait pas vocation à prendre, ce qui démontre bien l’importance des enjeux.

Neutralité

La technique est loin d’être neutre. L’on a rappelé ainsi l’impact qu’avaient les nouveaux modes d’accès à l’information, juxtaposition d’informations « décontextualisées »[4], sur l’appropriation de l’information et la construction du savoir. Le numérique implique aussi une convergence du patrimoine écrit vers d’autres formes du patrimoine (le son, l’audiovisuel,…), une fracture entre des usages savants et ceux du grand public et des compétences nouvelles à acquérir.

Le moteur de Google, simple « portier » du web, filtrerait les contenus en toute neutralité. Même s’il devait en être ainsi, ce dont on peut douter,  ne serait-ce que parce que la popularité n’est pas forcément toujours le critère le plus pertinent, confier l’ensemble du patrimoine mondial à un seul algorithme serait extraordinairement dangereux.

Diversité

D’autres moteurs que celui de Google existent, et ils sont tout autant performants. On a évoqué ainsi ceux que l’on utilise en entreprise, ceux qui sont spécialisés[5] et présenté des moteurs qui retrouvent des images à partir d’autres images, d’autres qui se traduisent par des cartographies ainsi que la plate-forme Polinum[6] qui propose un benchmarking permettant de tester les performances de plusieurs moteurs.

L’absence de monopole, ou plutôt d’abus de position dominante, c’est ce que les autorités américaines et européennes veilleront sans nul doute à ne pas voir s’instaurer. Mais l’absence de concurrence ne règle pas tout puisque subsistent les questions liées notamment au droit d’auteur[7], à la protection des données personnelles, au filtrage des accès, la conservation pérenne d’où l’idée soutenue par Robert Darnton[8] et Bruno Ory-Lavollée[9], pour qui l’Etat doit garder la maîtrise de ses fichiers  et de ses métadonnées et multiplier, en revanche, les licences d’exploitation accordées à  un large éventail d’acteurs.

Bibliothèques

En matière de numérisation, il leur appartient de faire un travail de recension, de mutualiser   leurs efforts et de veiller à la pérennité de la conservation. Elles doivent veilleraussi  à disposer d’un maximum de données (hébergées de plus en plus souvent aujourd’hui dans les nuages[10]) pour les valoriser en les hiérarchisant et en leur donnant du sens en fonction de divers publics. La part de l’humain reste incontournable, a-t-on également souligné, pour extraire les données pertinentes, créer des services autour des contenus, former aux usages du numérique. Mais s’il appartient aux bibliothèques de promouvoir une culture numérique et non de s’approprier les contenus, ce n’est pas à n’importe quelles conditions, mais à des tarifs raisonnables, sans censure par des filtres abusifs, dans le respect des données personnelles et du droit d’auteur et lorsque la conservation est assurée. Leur responsabilité  est engagée à ce titre.

Enjeux

On l’aura constaté encore une fois, bien au-delà des questions budgétaires mises quelquefois uniquement en exergue, les enjeux sont à la fois économique (impact sur la filière culturelle), juridique (impact mondial de la class action, recours entrepris aux Etats-Unis ; articulation de la loi et du contrat ; diffusion des œuvres orphelines et épuisées), technique (recherche d’information, conservation des fichiers), sociétaux (fracture numérique),  organisationnels (mutualisation), d’où l’importance des  décisions politiques qui seront prises  après la diffusion du rapport Tessier sur le numérisation du patrimoine, à la fin du mois de janvier 2010. On connaîtra alors les clauses  du troc, pour reprendre un autre terme utilisé lors de la journée, qui pourrait être organisé par l’Etat entre Google et la BnF.

Notes


[1] La conférence elle-même étant liée à l’éventuel accord de la BnF avec Google pour la numérisation des livres dans le cadre du programme Google Book Search.
[2]
Numérisation du patrimoine des bibliothèques et moteurs de recherche.  Programme du 8 janvier 2010 sur le blog lecteurs de la BnF
[3]
Droit d’auteur, numérisation du patrimoine des bibliothèques et moteurs de recherche, Paralipomènes, 7 décembre 2009
[4]
Contextualiser en donnant du sens aux informations, c’est l’une des vocations des bibliothèques numériques
[5]
A titre d’exemple, on citera le métamoteur de recherche documentaire en droit comparé et droits étrangers IMUR présenté sur la liste Juriconnexion le 8 janvier 2010. Site Juriconnexion
[6]
Polinum, plate-forme  collaborative de recherche et développement pour la numérisation et la valorisation des fonds patrimoniaux, industriels et informationnels, lancée en décembre 2009.
[7]
La question du droit d’auteur fera également l’objet d’un examen attentif par les juges, ce qui ne règle pas pour autant toutes les questions posées par le Règlement Google Livres.
[8]
Voir aussi : Google Livres. Des solutions alternatives même aux Etats-Unis, Paralipomènes, 11 décembre 2010
[9]
Partager notre patrimoine culturel. Propositions pour une charte de la diffusion et de la réutilisation des données publiques culturelles, Bruno Ory-Lavollée, 2009
[10]
Cloud Computing, une tendance de fond qui engage votre responsabilité, Paralipomènes, 24 novembre 2009

One comment

  1. […] Michèle Battisti 20 janvier 2010 à 14:38On en a tout de même un peu parlé en France.Voir la question de M. Nicolas Dupont-Aignan publiée au JO du 22 décembre 2009 à l’attention du ministre des affaires étrangères. Présenté par Juriscom.net, dans un article intitulé « Opacité autour des négociations sur l’accord commercial anti-contrefaçon, un député s’interroge », publié le 21 décembre 2009 http://www.juriscom.net/actu/visu.php?ID=1169 […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *