Préservation numérique : léguer le savoir | Février 2013


Préservation numérique : expertise, vision

La conservation des données numériques en vue de leur réutilisation future est une nécessité voire une obligation pour les entreprises, les administrations et plus généralement pour la société.

Interview 1 : Gilbert Coutaz, Directeur des Archives cantonales vaudoises

Actuel Directeur des Archives cantonales vaudoises, Gilbert Coutaz a présidé l'Association des archivistes suisses de 1997 à 2001. Il a siégé entre 1992 et 2000 au sein de la Section des Associations professionnelles du Conseil international des archives qui a rédigé le Code international des archivistes. Il est également une des personnes à l'origine de la formation postgrade en archivistique en Suisse.

- En 2002 déjà, vous avez participé à la rédaction d’un rapport intitulé « stratégie globale pour la conservation à long terme des documents électroniques en Suisse ». A votre avis, la société d’aujourd’hui a-t-elle conscience des enjeux liés à la préservation numérique ?

S’il y a une prise de conscience des enjeux liés à la préservation numérique, elle n’est cependant pas identique pour tous. Aujourd’hui, c'est l’immédiateté qui prédomine et la tendance actuelle pousse à ne pas penser à la conservation à long terme des documents électroniques. Dans ce contexte, parler de conservation perpétuelle surprend le plus souvent. Pourtant, une conservation pérenne doit s’envisager dès la conception d’un document.

- La pierre et le papier sont utilisés depuis la nuit des temps pour transmettre le savoir aux générations futures. Dans l’ère numérique dans laquelle nous vivons aujourd’hui, serons-nous encore capable de léguer des connaissances ?

Ce qui est inédit avec l'ère numérique, c'est que pour la première fois dans l’histoire de la civilisation, l'information n'est plus nécessairement liée à un support.

Cette dématérialisation est un risque pour la conservation des données car elle est fortement impactée par l’obsolescence rapide des technologies. Ainsi, dans notre profession d'archiviste, nous constatons que des applications qui ne servent plus au fonctionnement de l'administration sont purement oubliées, alors que certaines devraient être maintenues et versées aux Archives. L'identification tardive de l’importance de ces applications amène le plus souvent leur perte définitive car nous ne disposons plus des technologies qui permettrent de les exploiter.

- Selon vous, les hypothèses relatives à un Digital Dark Age sont-elles fondées ?

Si la production d'information n'a jamais été aussi dense et diversifiée, elle n'est pas à l'abri de vastes pertes et de l'amnésie. Le Digital Dark Age n’est donc pas une menace qui doit être éludée, mais ce danger est maîtrisable en mettant en place une stratégie de conservation numérique.

- Avec l’explosion du volume de données, est-il possible de stocker toutes ces informations indéfiniment ou seulement une partie de celles-ci méritent une attention particulière ?

Les archivistes sont comme Noé : pour eux, tout ne peut pas entrer dans l'arche et il faut choisir et garder ce qui "civilise". Ils prônent l'évaluation avec la sélection (conservation ou élimination). Tout conserver a un coût et cela présente l’inconvénient de ne pas hiérarchiser l’information.

- Certaines informations doivent donc être préservées à long terme. Mais quels sont les critères permettant de récupérer ces informations dans une masse de données qui s’accroit de manière exponentielle ?

A la différence des politiques d'archivage antérieures, il est désormais primordial d'établir dès la conception des documents, des cahiers des charges précisant ce qui est à éliminer, à échantillonner ou à conserver intégralement. Ensuite, le calendrier de conservation, les métadonnées, l'indexation, les migrations, la normalisation font partie des composantes de toute politique d'archivage électronique.

- Existe-t-il d’autres risques pouvant entraver la réutilisation des données numériques  sur le long-terme ? Si oui, comment les minimiser ?

Ce sont les modèles économiques qui sous-tendent l'informatique qui sont le plus grand danger (changement constant des logiciels, des matériels, des standards), ainsi que l'absence de moyens financiers. Assurément, la fracture numérique fera qu'il y aura des nantis, et qu'il y aura des démunis.

- Pensez-vous qu’un jour des normes d’archivage standardisées seront incluses dès la création d’un document digital ?

Il faut être conscient que le marché de l'archivage représente un créneau restreint et spécifique. La demande devra donc s'affirmer pour qu’un système de normalisation s’établisse. Cependant, la normalisation gagne tous les domaines et dans un monde complexe elle ne peut que s'accroître et encadrer toutes les démarches.

- Comment voyez-vous la préservation numérique évoluer dans ces vingts prochaines années?

L'informatique comme les autres domaines est le reflet de la société. Elle est davantage aujourd'hui perçue comme un outil de consommation que de conservation.

Les technologies sont appelées à remplacer de nombreux modes opératoires de l'humain, elles doivent cependant demeurer des alliés et des atouts pour lui. Ce qui est le plus probable, c'est qu'elles représenteront un élément de puissance et de domination de populations restreintes sur le plus grand nombre. Les dérives sont à craindre dans ce domaine, car nous allons vers de nouvelles forces d'asservissement et de subordination. Dans ce contexte, la préservation digitale doit servir de balise et de repère dans le flot informationnel. Il est essentiel que le continuum de la Mémoire soit garanti et soit partie intégrante de l'informatique.

 

Interview 2 : Jean-Marc Rietsch, président de la Fédération ILM, stockage et archivage (FedISA)

Jean-Marc Rietsch est ingénieur civil des Mines, expert en gestion des données numériques. Il préside actuellement la Fedisa - Fédération de l'ILM (Information Lifecycle Management). Il est également l’instigateur et co-auteur de plusieurs ouvrages sur l’archivage numérique et directeur d’un Mastère sur ce thème à l’école des Mines de Paris.

- Mails, fichiers, factures, la diversité et le volume de données numériques ont considérablement augmenté ces dernières années. Dans ce contexte, quel est l’objectif de la préservation numérique ?

L’augmentation du nombre de données numériques à la fois en termes de volume et d’origine est un fait. Ce nouveau paradigme oblige l’entreprise à se poser les bonnes questions en matière de préservation digitale : quelles données conserver, pourquoi les conserver, comment les conserver… La réponse à ces questions doit se faire en poursuivant un objectif principal : permettre aux utilisateurs de retrouver ces mêmes données/documents.

- Mal gérées, l’augmentation et l’accélération du volume de données peuvent être problématiques. On parle alors d’infobésité. Est-ce une fatalité ou est-ce qu’il existe des éléments-clés qui favorisent la préservation numérique ?

Il est tout à fait possible de bien gérer les données en mettant en place des dispositions techniques et organisationnelles. Pour cela, il est essentiel de prendre en compte les données numériques tout au long de leur cycle de vie, c’est à dire de leur création jusqu’à leur conservation ou destruction. Ensuite, il est fondamental de retenir un format de conservation pérenne et si possible normalisé comme le PDF/A. L’importance du format est supérieure à celle du support de stockage qui va obligatoirement évoluer. Il est également crucial de garantir l’intégrité du contenu informationnel grâce à des contrôles techniques.

- Autrefois, les documents étaient stockés sous forme papier puis archivés. Est-ce que la gestion dématérialisée engendre des changements fondamentaux dans la manière de gérer l’archivage ?

Ce serait une erreur de gérer les archives numériques de la même façon que le papier. L’archivage papier se fait avec une véritable rupture entre les données courantes et les données archivées « mortes ». Cette rupture engendre un changement de lieu, du bureau vers les archives !

Dans le mode numérique, il ne doit pas y avoir de rupture et donc inutile de continuer de faire la distinction entre : archivage courant, définitif, technique, etc. Il faut simplement répondre au besoin de l’utilisateur: retrouver une donnée rapidement, qu’elle soit dans le système d’information depuis quelques minutes, quelques mois ou plusieurs années.

- Si cette nouvelle manière de gérer les données peut être complexe et contraignante pour l'entreprise, est-ce qu’elle peut également être une source d’opportunités et de développement ?

On touche ici la véritable finalité du système d’information de l’entreprise qui, rappelons-le une nouvelle fois, doit assurer la conservation à long terme des données.

La sécurisation du système d’information et sa bonne organisation - trouver la bonne information au bon moment - ne constituent pas une fin en soi mais au contraire le début d’un processus qui va permettre d’utiliser l’information pour la valoriser en connaissance. De cette évolution va naître l’innovation, une des clés de la compétitivité de l’entreprise.

- Face au défi du stockage, du tri et de l’échange de données, les entreprises sont enclines à adopter des systèmes de knowledge management comme Salesforce. Est-ce qu’un tel logiciel ne représente pas l’avenir car il limite la production d’information et la rend plus pertinente ?

L’avenir ne peut reposer sur un seul logiciel ! La complexité de la gestion de l’information nécessite de faire appel à un ensemble d’outils et de compétences tant techniques, que juridiques et organisationnelles. En matière de logiciel, la véritable difficulté consiste à savoir trouver le bon compromis parmi les solutions existantes, en particulier, entre un système d’indexation traditionnel et des moteurs de recherche de plus en plus puissants qui structurent l’information et qui la transforment ainsi en connaissances (principe du web sémantique). La clé réside certainement dans les systèmes experts nouvelle génération, comme Dr Watson d’IBM, qui sont capables d’analyser les données d’une manière très pertinente et qui sont de véritables outils d’aide à la décision.

- Il est bien entendu impératif de conserver certaines données, notamment pour des raisons légales, mais cela engendre aussi un risque de surveillance accrue des personnes. Alors, est-il possible de concilier sauvegarde numérique et droit à l’oubli ?

Quand les données présentent un intérêt de conservation pour une durée très longue, il est possible de les sauvegarder en les rendant anonymes ou en demandant l’autorisation d’une autorité de protection des données personnelles comme le Préposé fédéral à la protection des données (PFPD) en Suisse ou la Commission nationale de l'informatique et des libertés (CNIL) en France. Bien entendu, si la législation requiert que les données soient supprimées, il est impératif de s’y soumettre.

- Quels conseils donneriez-vous à une société qui souhaiterait mettre en place un processus de préservation numérique. Comment peut-elle s’engager dans cette démarche ?

Pour commencer, il sera indispensable de définir les besoins en matière de conservation des données et les niveaux de sécurité requis. Cela nécessitera d’établir une politique d’archivage qui recensera notamment l’ensemble des obligations légales et des besoins internes. Une fois la politique d’archivage validée, elle servira de base à l’établissement d’un cahier des charges qui permettra de contacter des fournisseurs de solutions de préservation numérique.

 

Sources textuelles:

Le Monde informatique, Dr Watson d’IBM, prêt à exercer dans la santé, [en ligne], 2011, http://www.lemondeinformatique.fr/actualites/lire-le-dr-watson-d-ibm-pret-a-exercer-dans-le-secteur-de-la-sante-42427.html, [consulté le 4 février 2013] ;


dossier préparé par:


Thierry Boudol, Romano Hotz, Cyrille Lacroix