Quelles conditions pour libérer les données des archives publiques?

Journée d’étude organisée le 11 mars 2011 par l’Association des archivistes français (AAF)

Une exception culturelle dans la loi de 1978, la valorisation des données par des acteurs commerciaux, des données personnelles au centre du débat et des licences pour encadrer les usages. Oui, mais quels usages ?

  • Les archives sous les feux de la scène. Une ordonnance de 2005 qui transpose les règles d’une directive européenne de 2003 sur la réutilisation des informations du secteur public, des archives départementales saisies par des sociétés commerciales en 2009, une lettre ouverte de l’AAF soulignant le 6 juillet 2010 les risques pour les libertés individuelles de la création d’un fichier national de données sensibles, des débats sur les blogs, des départements proposant les premières licences et règlements, une décision de la CADA en septembre 2010 pour qui les données personnelles ne peuvent être utilisées comme motif de refus que si les dispositions de la loi ou règlementaires l’imposent ou s’il s’agit de données sensibles, la réaction de l’AAF à une interview de Bruno Ory-Lavollée qui mettait un peu trop en exergue la mission de conservation des archives, une délibération très attendue de la CNIL affirmant le 9 décembre 2010 que seules les données sensibles n’étaient pas réutilisables et qu’il était interdit de diffuser les noms de personnes nées depuis moins de 120 ans, des modèles de licences et de règlements diffusés par le Service interministériel des archives de France (SIAF) pour harmoniser les pratiques, et toujours des divergences dans les position des archives départementales face aux sociétés commerciales.

L’avis des autorités administratives indépendantes

Il était intéressant de savoir comment la Commission d’accès aux documents administratifs (CADA) avait interprété l’exception culturelle de l’article 11 de la loi de 1978 sur la réutilisation des informations publiques dans ses avis de mars 2010 donnés à propos du refus de remettre des cahiers de recensement à une société commerciale. S’appuyant sur l’esprit de la directive européenne visant à créer un marché de la réutilisation à caractère commercial, elle a considéré que l’exception ne donnait pas aux établissements culturels un pouvoir discrétionnaire de refuser la réutilisation, mais uniquement de fixer les règles de la réutilisation. Les données personnelles ayant servi d’argument pour ce refus, la  CADA a donné un deuxième avis, en septembre 2010[1], en s’appuyant sur l’article 13 de la loi de 1978. Si, selon la CADA, la présence de données personnelles ne permet pas d’interdire la réutilisation, celle-ci doit être encadrée, en interdisant notamment la réutilisation des données des personnes nées depuis moins de 120 ans. La CADA reconnaît avoir été sur un terrain incertain, le chiffre de 120 ans ne s’appuyant sur aucun texte, ou lorsqu’elle affirmait que les établissements ne disposaient pas d’un pouvoir discrétionnaire et qu’il y avait un droit général de réutilisation, ou encore lorsqu’elle soutenait que le droit commun ne s’appliquait pas, sans donner de précisions sur la nature du droit qui devait s’appliquer. Y aura-t-il un droit spécifique aux établissements culturels construits en partie par le juge  ou est-ce que les établissements tomberont finalement dans le droit commun de la réutilisation ?

Et ce fut au tour de la CNIL de donner son avis, dans une délibération du 9 décembre 2010, détaillée, elle-aussi, lors de cette conférence. La CNIL y a confirmé que l’existence de données personnelles ne permettait pas de s’opposer à une réutilisation de documents provenant des archives publiques, même si la réutilisation est commerciale. Si le consentement exprès de toute les personnes concernées potentiellement vivantes, soit âgées de moins de 120 ans, n’est pas requis, l’opération étant jugée trop complexe, le traitement doit être déclaré à la CNIL et c’est elle qui évaluera les garanties à apporter avant de donner son autorisation. La CNIL met néanmoins une série de garde-fous puisqu’il est interdit de réutiliser les données sensibles des personnes vivantes et des personnes décédées, que toute personne vivante peut demander, sans condition, la suppression des données la concernant et que les ayants droit des personnes décédées peuvent exiger, sur justification en revanche, la suppression des données susceptibles de leur porter préjudice. Autres garde-fous : veiller à ce qu’il soit impossible aux moteurs de recherche d’indexer des données relatives aux personnes nées depuis moins de 120 ans, obtenir toutes les garanties nécessaires en cas de recours à un prestataire, et faire une demande d’autorisation ou d’avis préalable auprès de la CNIL en cas de transferts hors Union européenne ou d’une interconnexion de fichiers contenant des données produites par des administrations différentes.

Du côté des archives

  • Une autre perspective : accompagner l’utilisation de ses données

Puisqu’il serait non seulement inutile mais contreproductif de refuser d’accompagner les mouvements économiques et sociaux de la révolution numérique, selon Bruno Ory-Lavollée, auteur de deux rapports sur la diffusion numérique des données culturelles[2], il est de l’intérêt des archives, comme des autres acteurs du secteur public, de proposer le plus large éventail possible de licences de réutilisation de leurs donnée. Ces licences doivent toutefois être encadrées pour accroître la visibilité des établissements, contenir des garde-fous notamment en regard des données personnelles et, bien que cela soit complexe, établir des frontières claires entre les usages gratuits et les usages payants, entre les usages publics et les privés. Le défi pour les archivistes  sera plutôt de répondre à la multiplicité des demandes, les licences ayant créé des attentes nouvelles vis-à-vis de la collecte et de la conservation, « sans perdre les axes séculaires, et à penser aux attentes du futur ».

  • Rennes une ville qui décoiffe

Mettre ses données gratuitement à la disposition de tous, y compris pour des usages commerciaux, c’est le choix fait par la ville de Rennes qui enregistre déjà les impacts sociétaux et économiques bénéfiques de l’ouverture de ses données. Favoriser l’innovation, c’est l’esprit même de la directive européenne. Et de prôner de nouvelles formes de management public, fondées sur l’intuition et l’innovation, adaptées à cette période de rupture, et non tenter à tout prix de garder la maîtrise de ses données et de ses produits, au risque d’être d’ailleurs rapidement dépassé par d’autres acteurs. Si, comme on l’aura appris en fin d’exposé, les élus rennais n’ont pas encore pris position sur l’ouverture des archives, cela ne saurait tarder et il sera intéressant d’examiner l’impact de cette décision.

  • Pas de Calais, Bas-Rhin et Cantal … décalages

Pour les archives du Pas de Calais et du Bas-Rhin, tout ne sera pas libre et gratuit. S’appuyant sur la directive et sa transposition dans la législation française qui ménagent un régime dérogatoire pour les archives, des règlements et des licences ont été rédigé pour couvrir tous les usages (lecture, base de données, relevés, …), exclure les données qui ne sont pas librement communicables ou celles qui sont la propriété des tiers (archives privées). Ces documents se conforment aux avis de la CADA et de la CNIL, tant sur  les règles à adopter pour les données personnelles que sur l’impossibilité, sauf motif d’intérêt général, d’opposer un refus. Et d’inviter les archives départementales à rédiger des règlements de licence. On ne peut que renchérir, l’absence de licence étant particulièrement hasardeux[3].

Sans « opposer ceux qui résistent à ceux qui pactisent », « refuser la réutilisation n’est pas tenable juridiquement », et les règlements et les licences répondent non seulement à un besoin juridique mais aussi au choix politique de chaque collectivité. On se heurte toutefois à un vide juridique, soit l’absence de jurisprudence et de modèle licence ou de tarification alors qu’il convient d’adopter un dispositif applicable au quotidien et mesurable. Comme l’exige la loi  (le régime de droit commun de la loi, notai-je), plusieurs licences doivent être conçues tenant compte de l’usage des images et non de la qualité du demandeur, et aucune licence exclusive n’est envisageable. « Pas de panique » ! 90 % des licences sont gratuites et le formulaire à signer vise, dans la plupart des cas, uniquement à rappeler certaines obligations, notamment d’indiquer les sources (mentions, lien, logo, ..) pour protéger l’intérêt de la collectivité. Il n’y pas de transfert de propriété, le téléchargement est interdit, tout comme les sous-licences. Quant aux redevances, elles visent à compenser les investissements réalisés et un service rendu. Des sanctions sont aussi prévues pour défaut de signature de licence. L’exception culturelle ? Elle serait mise à mal par la CADA et l’on note un projet de révision de la directive européenne  qui pourrait placer les données culturelles dans le régime du droit commun[4].

Il convient aussi de sensibiliser les publics (y compris les lecteurs en salle publique) à la révolution que représentent le poids et la valeur économique des archives. Pour les archivistes, il convient dès lors d’être vigilants afin de rester des acteurs en accompagnant ce changement et non en le subissant. Rester visible, c’est le défi majeur et la concurrence d’autres acteurs doit être perçue comme une opportunité, celle d’être obligé d’innover.

Une position radicale que celle des archives départementales du Cantal qui vont devant la justice « pour trancher des incohérences de la loi baptisées  incertitudes juridiques ». Les archives, établissements culturels, auraient un pouvoir discrétionnaire de refuser certains partenariats pour des motifs d’intérêt général (la protection des données personnelles, ou la vente des actes parmi des contenus inappropriés) et d’appliquer les tarifs de leur choix lorsque les fins sont lucratives. Les archives, proactives, assurent déjà largement « la dynamique du web patrimonial », et de prendre l’exemple de leur projet d’indexation collaborative, répondant au souci d’accroître la visibilité et le rôle du service public, ou ce « YouTube des archives » permettant au public de déposer des cartes postales ou des photos libres de droits » et de procéder à leur indexation, validée par le service public. Il s’agit de se battre pour la conservation d’un «  modèle démonétisé » et d’un marketing territorial par la  mise en valeur d’un fonds et d’alimenter une seule économie, celle du savoir du savoir. Quant aux partenariats, ils ont établis avec des sociétés de généalogie, les internautes, voire avec des sociétés privées pour développer des applications. Doutant que la généalogie commerciale soit dans « sens de l’histoire », il s’agit de se battre pour « un modèle de partage, dissémination, où le service public est une instance de régulation scientifique, juridique et éthique ».

Du côté des utilisateurs

  • Les sociétés commerciales, à l’origine et au cœur du débat

Pourquoi ne puis-je manquer de penser à Google lorsque Ancestry, société commerciale américaine, affirme ne s’intéresser qu’à l’état-civil, une partie infime des fonds des archives, et ne s’adresser qu’à une population qui ne vient jamais aux archives ni sur les sites de généalogie pour les réorienter vers divers sites en échange d’un abonnement ? Ancestry qui entend contribuer à la valorisation et à la préservation des les archives et créer un « cercle vertueux pour que la généalogie devienne une pratique culturelle courante », doit pour cela obtenir des licences équitables, lui donnant des garanties, et à un prix « juste », et rappelle que, conformément à la CNIL seules les données sensibles doivent être anonymisées. Et de prôner le modèle de la ville de Rennes, et les réalisations faites dans d’autres pays, comme le Royaume-Uni, où les chercheurs bénéficient d’une base nationale de données des recensements.

Comme Ancestry, Genéalogie.com vise le grand public qui ne connaît pas (encore) les archives. Dans une table-ronde consacrée aux données personnelles, Généalogie.com s’est voulu rassurant. Il a rappelé les réalisations faites par diverses associations (pour dresser des arbres généalogiques ou à des fins successorales) et par le secteur public, et que son métamoteur de recherche répond par l’affichage d’une image du document qui a « un caractère émotionnel » et sert de preuve. Mais la prise d’image est réalisée en partenariat avec les autorités détentrices et l’indexation entraîne le « zonage » des données sensibles ou les données de personnes en vie en conformité avec les préconisations de la CNIL[5], encadrée par un correspondant informatique et liberté (CIL), que cette opération est manuelle pour assurer sa fiabilité, et qu’en matière d’anonymisation sa base va au-delà de ce qui se fait dans les archives départementales.

  • Un tiers secteur bousculé et désemparé

Ce secteur ni public ni privé que sont les sociétés de généalogie «  refuse d’être enfermé dans un carcan à cause du secteur privé commercial’. Pas de licence donc pour relever des actes afin d’alimenter ses propres bases de données, et une réutilisation libre et gratuite des contenus, ce qui va de soi, mais aussi des images utilisées à des fins de preuve soit à des fins scientifiques, même lorsqu’elles figurent dans une publication payante. Et de s’indigner de se trouver face à des règlements leur opposant une matrice distinguant une réutilisation avec ou sans images, avec ou sans diffusion commerciale, car si ces sociétés génèrent un chiffre d’affaires, il ne s’agit que de distribuer les travaux de leurs membres. Une licence ne serait requise que lorsque l’image est vendue en tant que telle ou pour accompagner un index. Non assujetties à la TVA, le fisc ne les considère-t-il pas comme des sociétés non commerciales ? Ce que prône le tiers secteur, c’est un règlement simplifié qui tienne compte des chercheurs et qui soit harmonisé  au niveau national.

  • La parole éclairée d’un généalogiste amateur

Des licences certes, mais des licences lisibles applicables, et une harmonisation lorsque les membres de sa famille sont éclatés sur 45 départements différents. Que dire aussi de ces licences qui interdisent les sous-licences alors que le généalogiste est « partageur » ! Il ne devrait pas y avoir d’interdiction pour les usages non commerciaux. Des solutions aussi lorsqu’il a été souligné qu’il fallait indiquer de manière visible et lisible les conditions de réutilisation en ligne sur les sites web, proposer des licences clics et élargir le champ des utilisations d’images faites à des fins non commerciales. Des propositions très concrètes et utiles aussi lorsqu’il a été indiqué qu’il serait judicieux de proposer des liens permanents ou des lecteurs exportables pour éviter de recourir au téléchargement, que ne recherchent pas la plupart des internautes.

Les autres acteurs

  • Un partenaire potentiel : la fondation Wikimédia

Plusieurs projets sont menés en ce moment par Wikimédia et la ville de Toulouse, prochainement sans doute avec les archives de la ville. Quelque soit le secteur, public, privé ou tiers, Wikimédia se moque de savoir avec quel secteur (public, privé ou tiers), ce sont bien d’autres données que celles de l’état-civil qui présentent un intérêt. Wikimédia contribuerait ainsi à les mettre en valeur. L’intervention a permis de rappeler qu’il convenait de dissocier œuvre, image  et données, et si Wikimédia a incité les archivistes à mettre en ligne leurs instruments de recherche, qu’il fallait prendre conscience que dès lors que ceux-ci étaient mis en ligne sur ces plates-formes, ils étaient non seulement modifiables mais aussi réutilisables commercialement, et que si certaines licences, comme les licences Creative Commons sont appliquées aux œuvres, d’autres licences, comme l’ODBL, sont plus adaptées aux données, et qu’il convenait donc de veiller à leur compatibilité.

  • La voix des Archives de France

La déconcentration aurait pu être un handicap. En fait, c’est elle qui a permis de permis de voir fleurir de nombreux de sites web des services d’archives particulièrement riches et divers. En cette fin de conférence où beaucoup de choses ont été dites, on y a souligné l’ambiguïté de la notion de valorisation, le fondement même du métier d’archiviste, qui doit être sans doute envisagée aujourd’hui en partenariat, le problème juridique que représente l’interdiction des sous licences pour le développement du marché, la vision économique de la réutilisation à encadrer, la frontière ténue qui existe entre les usages commerciaux et non commerciaux, la menace que représente le droit de réutilisation sur le droit d’accès au document qui doit rester gratuit, les licences à encadrer et l’enjeu qui consiste pour les archivistes à rester des acteurs de la diffusion culturelle.

Illustr. Database at Postmasters, March 2009, Mandiberg, CC 2.0 by-sa. Flickr

Savoir plus :

Polémique googuélienne autour de la généalogie française, Michèle Battisti, Paralipomènes, 18 août 2010

Ils en ont parlé aussi

Les données culturelles resteront-elles moins libres que les autres (malgré la licence IP) ? Lionel Maurel, S.I.Lex,  28 avril 2010

Numérisation des archives départementales. La fin d’un monopole ?  Samuel-Fréderic Servière, IFRAP, 10 novembre 2010

Archives publiques et données à caractère personnel, Droit cri-tic, 1er février 2011


[1] Il est surprenant de découvrir que tous les avis d’une commission d’accès aux documents administratifs ne puissent pas être consultés,  comme cela semble être le cas de l’avis du 13 septembre 2010.

[2] La diffusion numérique du patrimoine, dimension de la politique culturelle en 2002 et Partager notre patrimoine culturel en 20010

[3] C’était l’une de mes conclusions dans l’article suivant : Libérons les données ! De quelques aspects juridiques, Michèle Battisti, Paralipomènes, 4 mars 2010

[4] Dans la une consultation publique sur la directive européenne sur les informations du secteur public, proposée par la Commission européenne au cours de l’automne 2010, plusieurs questions avaient trait aux données publiques culturelles.

[5] Le masquage des données de plus de 120 ans dans les images et des données des personnes décédées dans les index et une suppression définitive de données sensibles.

Un commentaire

  1. [...] Quelles conditions pour libérer les données des archives publiques? (Paralipomènes) CR de la journée d’étude de l’AAF sur la réutilisation des données publiques. [...]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>