» Acquisition

Archiver l'information



Section 7. Pérennité du document numérique

Plan de la section[ masquer ]

Important


La caractéristique essentielle du document numérique par rapport au document papier tient en sa structure.


Le document papier se donne à voir dans sa simplicité voire dans la transparence de sa texture.
Le document numérique au contraire cache beaucoup plus de choses qu’il n’en montre.

-

§1. Distinction

L’objet numérique dont la conservation est demandée est le document numérique. Toutefois, les textes qui exigent sa conservation intègre (archivage) ne prennent pas en compte la spécificité de cet objet. Celle-ci réside dans sa structure. La structure d’un document papier se réduit techniquement…à la qualité des fibres du papier et de l’encre utilisés.


Remarque

Celle d’un document numérique est un ensemble beaucoup plus complexe.



Elle comporte TROIS grands aspects :

Sa présentation visuelleLes données qu’il contientLes métadonnées
La présentation visuelle du document résulte de la manière dont il donne à voir les données qu’il comporte.Les données sont constituées par les informations, formant un message intelligible saisi en mémoire d’ordinateur : les mots, les chiffres, les images.Les données sont générées par le système, via l’utilisateur.
Les métadonnées sont les informations générées par le système, parallèlement au contenu du document, et sans que l’utilisateur en ait conscience.
Remarque

Elles sont généralement invisibles pour l’utilisateur. Elles tracent notamment les modalités de l’élaboration du document.





-

§2. Représentation

A côté des métadonnées qui le structurent, l’apparence physique du document peut varier en fonction du système d’information dans lequel il est lu.


Exemple

Ainsi un message électronique écrit en HTML n’a pas la même apparence en mode texte brut. Pour autant, il s’agit bien du même contenu.



Mais formellement, les changements matériels intervenus dans sa structure, donc dans sa présentation peuvent en changer le sens ou sa portée.

§3. Pérennité du document numérique

Un document électronique ne peut être bien conservé à long terme s’il n’a été organisé, ni pourvu, dès sa création de la plupart des métadonnées nécessaires à sa conservation. Ces métadonnées concernent évidemment l’identification du document et ses différentes versions, sa description et son contexte de création, son classement au sein d’une arborescence pérenne, la gestion de son cycle de vie, la gestion à long terme de son accessibilité. C’est également la mise en relation et en perspective des documents et données avec d’autres documents qui donne ou ajoute du sens.

§4. Les métadonnées utiles à la pérennisation

Il existe de nombreux standards de métadonnées.

Conseils, trucs et astuces


Le plus usuel et le plus simple est le Dublin Core normalisé sous la référence ISO 15836 (voir chapitre Références et modèles).


Il propose quinze éléments pour gérer des documents et des données dans un but de pérennisation.
La plupart des outils informatiques permettent aujourd’hui de gérer correctement les métadonnées.
Les plus importants sont :

L’identifiantLes métadonnées de descriptionLes métadonnées de pérennisation
Il doit être unique dans l’organisation. Il doit être le plus simple possible.
  • les auteurs
  • un titre
  • un type qui associé au classement peut déterminer son cycle de vie (durée d’utilité et durée de conservation)
  • une date de référence
  • les relations (appartenance à un dossier, un projet, une affaire …)
  • un état : sa vie en compte quatre (document de travail, document validé, document périmé)
  • les durées d’utilité : la durée d’utilisation (DUA) contient les deux premiers âges du cycle de vie ( actif ou vivant, semi-actif ou intermédiaire). L’âge actif est celui durant lequel le document sert quotidiennement pour le suivi des affaires. L’âge semi-actif est celui durant lequel le document est plus rarement utilisé. Lorsqu’il n’a plus d’utilité et n’a plus qu’une utilité de mémoire, le document peut-être conservé pour une besoin historique ou de manière définitive. (voir chapitre sur les durées)
  • la durée de conservation : Elle est déterminée en fonction du type du document, de ses usages et des risques qu’accepte de prendre l’établissement ou l’organisme.
  • un historique : Il s’agit de la gestion des versions. Chaque action doit être horodatée et on doit conserver l’identité de l’auteur.
Ce sont essentiellement des données techniques. Elles donnent de l’information sur les formats de données, sur les systèmes qui ont servi à les produire et sur leurs versions. Elles sont indispensables pour assurer la lisibilité des données et permettre la migration d’un format à un autre mieux maîtrisé.
Ce sont aussi ces métadonnées qui vont régir l’accès de chaque individu aux données. On doit se conformer à la loi de 1978 et à l’ordonnance de 2005 pour tout accès.


§5. Usage des métadonnées

Elles servent à identifier le bon document dans le cadre d’une recherche ou d’une transmission.

Elles servent aussi à automatiser les transferts vers des systèmes d’archivage à long terme.

§6. Conservation

Compte tenu de l'évolution particulièrement rapide des technologies, la conservation sur le long terme représente un véritable défi dont la réponse est autant technologique qu'organisationnelle.

  • Ceci nécessite d'une part un codage des données indépendant des systèmes :
    • soit par des formats de codage très simples, ouverts et de ce fait relativement pérennes ;
    • soit par des formats normalisés adaptés à la conservation, comme le PDF;
    • soit par une structuration des données de type XML qui permet de s'affranchir d'un format propriétaire tout en facilitant la navigation au sein du document et son exploitation.

-

  • D'autre part s'ajoute à cela la nécessité d'effectuer des migrations périodiques vers de nouveaux supports.

La conservation dans le temps ne touche pas que les supports, les contenus risquent également de perdre de leur exploitabilité s'ils ne sont pas entretenus car plus le temps passe et plus l'information peut devenir difficile d'accès.

Par ailleurs la conservation de la signature numérique pose un véritable problème dans la mesure où elle interdit toute migration de format de codage (au risque de perdre son intégrité) pourtant indispensable afin d'assurer la lisibilité sur le long terme. Cependant ceci est vrai si l'on veut conserver la possibilité de vérifier la signature dans le temps. En revanche, il est tout à fait possible de vérifier la signature une fois pour toute avant l'archivage des documents et de conserver la trace de ces contrôles en ayant par exemple recours à un tiers du type autorité de gestion de preuve qui par ailleurs permettra également de régler le problème de la faiblesse de tout procédé cryptographique qui ne peut résister indéfiniment aux avancées et évolutions techniques qui font qu'un jour ou l'autre il sera percé.

Important


L'archivage électronique se doit par définition de garantir la pérennité mais plus encore, dans la mesure où il correspond à l'organisation raisonnée d'une conservation sécurisée de l'information créée aujourd'hui afin de pouvoir la réutiliser demain ou après demain.



Remarque

De plus en plus ce besoin d'archivage est ressenti comme une nécessité pour les entreprises et devient une obligation.



-