Informationswissenschaft: Theorie, Methode und Praxis / Sciences de l'information: théorie, méthode et pratique. Группа авторов. Читать онлайн. Newlib. NEWLIB.NET

Автор: Группа авторов
Издательство: Bookwire
Серия:
Жанр произведения: Документальная литература
Год издания: 0
isbn: 9783039198924
Скачать книгу
du paquet, autant les données électroniques entre elles que les métadonnées associées à chacune.

      L’information de description (Descriptive Information) est constituée des catégories précédentes. Elle permet de rechercher, de trouver et d’analyser les données électroniques pérennisées.

      L’information de représentation (Representation Information) doit permettre de transformer la succession de bits (0 et 1), qui forme tout document numérique, en un contenu intelligible pour l’homme. Elle se compose de l’information de structure (description du format) et de celle sémantique (par exemple, l’indication de la langue d’un texte). Sa conservation est rendue obligatoire par le fait que sa durée de vie est relativement courte.9

      Standard eCH-0160: Interface de versements d’archives (SIP)10

      A l’origine de ce standard se trouve le profil de métadonnées des Archives fédérales suisses qui a été retravaillé en collaboration avec le Centre de coordination pour l’archivage à long terme de documents électroniques dans le but de permettre son utilisation hors de l’administration fédérale. L’association eCH l’a accepté comme standard national en novembre 2012. Cet organisme de standardisation adopte des normes pour la cyberadministration en Suisse.

      Ce profil a été conçu pour des versements de documents issus de logiciels dédiés à la gestion électronique des documents (paquet d’informations de type GEVER11) ou de systèmes de fichiers et de bases de données relationnelles (type FILES).

      Description du profil de métadonnées

      La documentation se compose d’une spécification (qui définit comment un versement numérique peut et doit se faire), d’un dictionnaire de données et d’un schéma XSD.12 Comme la lecture de fichiers encodés en XML n’est pas aisée, nous ne rentrerons pas dans les détails de ce dernier document qui constitue, en fait, une vue réelle de la structure d’un paquet d’informations.

      La spécification propose un modèle conceptuel de données qui se compose de treize classes UML13 non détaillées et de leurs relations. Dix de ces treize classes constituent des entités explicitement présentes dans le SIP et décrites dans le dictionnaire de données. D’après OAIS, toutes peuvent être considérées comme des informations de description.

      La classe intitulée «Paquet» contient des informations d’empaquetage qui permettent de comprendre la structure du paquet, de l’identifier et de documenter très sommairement les événements l’ayant affecté.14

      L’entité «Versement» informe sur le contexte, en particulier sur la provenance, et sur les droits d’accès défini d’un commun accord entre le service versant et les archives pour le SIP entier.

      Les informations contenues dans «Provenance» documentent le contexte et la provenance en proposant des champs de métadonnées sur le producteur des documents (nom, période d’existence et histoire).

      Les informations de contexte sont encore complétées par l’entité «Système de classement» qui se concentre sur le logiciel de gestion des documents (si existant), une base de données ou toute autre source d’informations à pérenniser.

      Figure 2: Modèle conceptuel des données (Groupe spécialisé Archivage numérique: Interface de versements d’archives [SIP], Zurich 2012, 18)

      Les trois classes suivantes, «Position du système de classement», 15 «Dossier» et «Document», forment la structure du plan de classement du fonds d’archives, ou tout du moins la partie concernée par le versement. Elles renseignent sur l’identification, le contexte et les droits d’accès, mais à leur niveau respectif. Aucun renseignement relatif aux caractéristiques techniques des fichiers n’est indiqué ici. Ce genre d’informations se trouve dans l’entité «Fichier».

      En listant tous les fichiers et les dossiers constituant le SIP ou l’AIP, la «Table des matières» appartient à la catégorie définie par OAIS pour les informations d’empaquetage.

      L’entité «Répertoire», qui ne doit pas être confondue avec celle du «Dossier», concerne essentiellement l’identification du contenant physique du fichier versé.

      Quant à la classe «Fichier», elle reprend les mêmes informations que la précédente, mais en les complétant avec des métadonnées relatives aux sommes de contrôle. Ces dernières représentent un mécanisme de vérification de l’intégrité des données conservées.

      «Processus archivistique» documente les événements qui touchent principalement la vie du paquet, de sa réception aux archives (contrôles de qualité du versement: formats, présence ou non de virus, etc.) aux mesures de préservation (par exemple, la migration).

      La classe «Annexe non structurée» décrit des fichiers ajoutés au paquet d’informations en tant que renseignements supplémentaires. Selon la spécification, elle ne devrait plus être employée et sera peut-être même supprimée dans une prochaine version du standard.16

      Enfin, la «Note archivistique» permet aux archivistes d’annoter un ou plusieurs objets lors des contrôles manuels du versement et du processus d’archivage dans le magasin numérique.

      En observant le dictionnaire de données, nous constatons que les métadonnées du SIP sont quasiment identiques à celles de l’AIP. En effet, le document contient déjà des champs de métadonnées relatifs à la gestion des AIPs, à savoir leurs différentes identifications dans l’entité «Paquet» et la consignation des événements dans «Processus archivistique».

      Adéquation avec OAIS

      Le modèle de référence OAIS définit des catégories d’information qui concernent directement ou indirectement un ou plusieurs objets d’information à pérenniser et le paquet d’informations lui-même. Le niveau de détail est laissé au choix des institutions responsables de l’archivage numérique, car les concepteurs d’OAIS le considèrent déjà probablement comme une étape de la mise en application d’un tel système.

      Pour le standard eCH-0160, la granularité reste à un niveau élevé, en particulier pour les informations d’intégrité et de droits d’accès. Certes, les sommes de contrôle sont calculées et vérifiables pour les fichiers, mais la traçabilité des événements et les délais de protection sont indiquées respectivement au niveau du paquet et dans les entités «Position du système de classement», «Dossier» et «Document».

      En outre, aucune information de représentation n’est disponible dans ce profil de métadonnées. Aucun champ de métadonnées n’a été prévu pour indiquer le format. Un moyen d’introduire ce renseignement serait d’utiliser le champ de métadonnées «Propriétés» en définissant la paire d’attributs comme suit: propriété = format et valeur = nom du format.

      A long terme, il pourrait être pertinent de définir un champ expressément dédié aux informations de représentation. Dans l’idéal, le nom du format et un lien (non dynamique, sous la forme d’un identifiant) vers un référentiel regroupant les informations techniques sur les formats adaptés à l’archivage numérique devraient être introduits dans ce profil de métadonnées.

      Avantage et désavantages

      Comme le profil de métadonnées se décline en deux types (GEVER ou FILES), l’évaluation des métadonnées n’est pas une tâche requise. Ainsi, elle n’implique pas l’engagement de ressources humaines et financières qui peuvent donc être utilisées pour d’autres activités et projets du centre d’archives. Découlant de cette constatation, ce profil de métadonnées tend à permettre une plus grande automatisation du