L’inconvénient majeur de ce standard se rapporte à son orientation qui est très, voire trop, tournée sur les besoins de l’administration fédérale. Il peut représenter un frein certain à son utilisation dans d’autres organismes publics (cantons ou communes) et privés (entreprises). A titre d’exemple, mentionnons la présence de notions spécifiques, comme GEVER, ou de contraintes issues de l’environnement propre aux Archives fédérales suisses, telle l’absence d’un champ de métadonnée pour la cote. Le premier exemple se réfère au projet de mise en œuvre du Records Management au sein de l’administration fédérale. Quant au second, il tend à montrer que le profil de métadonnées n’est pas suffisamment neutre et générique pour d’autres institutions: le champ cote peut être très utile pour des institutions faisant de la numérisation de documents qu’elles conservent et qui portent déjà une cote. Certes, il est possible d’utiliser le champ de métadonnée «Données supplémentaires», mais il s’agit d’une solution «fourre-tout». Par analogie à l’évaluation des plans de classement, les positions «Divers» contiennent tout ce qui ne peut pas être classé ailleurs et ne sont pas conservées sur le long terme. Les bonnes pratiques tendent à éviter le plus possible leur utilisation, ce qui devrait aussi se faire pour les métadonnées et le champ «Données supplémentaires».
L’absence d’information de représentation peut poser un problème pour la conservation des données électroniques et pour les mesures de préservation. Le paquet d’informations n’est dès lors plus indépendant de l’environnement logiciel. En effet, cette information peut exister dans le logiciel de gestion de la plateforme d’archivage, mais elle n’est, dans ce cas, pas directement rattachée au fichier concerné.
Ne s’appuyant pas sur des standards de métadonnées connus internationalement, ce profil de métadonnées peut engendrer des coûts supplémentaires lors de l’acquisition du logiciel de gestion de la plateforme d’archivage numérique, dont les fournisseurs sont plutôt étrangers à la Suisse. L’un des tests proposé par ce genre d’application consiste à garantir la conformité du fichier contenant les métadonnées. Il faut dès lors le personnaliser entièrement selon ce profil de métadonnées.
Matterhorn METS17 Profile
Ce profil de métadonnées a été élaboré en collaboration par les Archives de l’Etat du Valais et par l’entreprise Docuteam GmbH. Il s’appuie sur les deux standards internationaux et principaux de l’archivage numérique: METS et PREMIS, 18 qui sont créés et maintenus par la Bibliothèque du Congrès (Etats-Unis). De plus, il combine les trois normes du Conseil international des archives: ISAD(G)19 pour la description des documents d’archives, ISAAR(CPF)20 pour les producteurs et ISDF21 pour les fonctions. En novembre 2012, le profil de métadonnées a été publié par la Bibliothèque du Congrès sur son site internet. Il est devenu «the first profile that describes the use of EAD within METS in any detail», 22 c’est-à-dire qu’il est le premier profil à contenir la description des documents d’archives sous la forme de la description archivistique encodée (Encoded Archival Description, EAD).
Le Matterhorn METS Profile est un profil générique qui s’adapte à différentes utilisations. Il répond à une exigence émise lors de sa création, puisque la plateforme d’archivage des Archives de l’Etat du Valais sert également à la Médiathèque Valais et aux Musées cantonaux.23 Ce profil représente donc le premier niveau d’une hiérarchie en comportant quatre au total.
D’abord, le profil générique contient les métadonnées communes à chaque paquet d’informations.
Vient ensuite le profil utilisé par chaque institution. La différence majeure à ce niveau correspond au standard utilisé pour la description: il s’agit de l’EAD pour les Archives de l’Etat du Valais et du Dublin Core pour la Médiathèque Valais et les Musées cantonaux.
Figure 3: Structure en quatre niveaux d’un SIP contenant des documents créés lors du processus de décision du Conseil d’Etat
Le niveau suivant se détermine par le processus à l’origine des documents (exemples: processus décisionnel, de numérisation, etc.).
Enfin, le profil d’implémentation est constitué des métadonnées définitives du paquet d’informations versé et archivé. Il est adapté après une évaluation des métadonnées générées par le logiciel à l’origine des documents.
La figure 3 montre un exemple concret d’un paquet numérique contenant des documents créés lors du processus décisionnel du Conseil d’Etat.
Description du profil de métadonnées
La documentation du Matterhorn METS Profile se résume à l’heure actuelle au schéma XML disponible sur le site internet de la Bibliothèque du Congrès. Sur demande aux Archives de l’Etat du Valais ou à Docuteam GmbH, une carte de métadonnées est disponible.
Comme auparavant, le schéma XML est laissé de côté afin de pouvoir se concentrer sur sa représentation graphique qu’est la carte de métadonnées. Ce document est construit à l’aide de classes UML détaillées: les attributs, sous la forme de nom des métadonnées, sont mentionnés. Bien évidemment, les relations entre les différentes classes sont également indiquées, mais ne seront pas toutes commentées dans les pages qui suivent.
Le standard METS sert de container aux métadonnées. Sa structure se compose de cinq parties: l’en-tête METS, la section des fichiers et la carte de structure dont le contenu correspond à l’information d’empaquetage d’OAIS, la section des métadonnées descriptives qui représente l’information de description et la section des métadonnées administratives où se trouve l’information de pérennisation.
Figure 4: Carte de métadonnées du Matterhorn METS Profile24
Graphiquement parlant, ce container METS est lié à l’interface entre le producteur et les archives. Cette information n’est pas une catégorie d’informations en tant que telle, mais un outil nécessaire pour régler les versements de documents. Il s’agit du protocole de versement (submission agreement) qui documente la provenance des données électroniques et les modalités du versement. Dans ce document est, entre autres, défini le profil de métadonnées à employer.
L’information de pérennisation (le rectangle au centre de la figure 4) est encodée en PREMIS. Ce standard international propose un dictionnaire de données nécessaires au bon fonctionnement d’une infrastructure pour l’archivage numérique. Sa conception envisage que les métadonnées soient complétées automatiquement par les logiciels liés à l’archivage numérique. PREMIS se compose de cinq entités, dont quatre sont ici présentes. L’entité «Objet» permet de documenter techniquement le (ou les) fichier(s) pérennisé(s) avec, par exemple, le format, la taille ou un lien vers les droits d’accès correspondants. Ces derniers se trouvent dans l’entité «Droits» qui contient, sous la forme de métadonnées ou de liens, toutes les informations relatives aux droits d’accès, soit quels droits sur quels objets possède tel groupe d’utilisateurs ou agents. Cette notion est justement le titre de la troisième entité de PREMIS. Elle donne le nom des agents et des liens, dont un qui pointe vers les événements que l’agent peut effectuer. Les renseignements sur les événements forment la dernière entité, intitulée «Evénement». Il s’agit essentiellement du type et de la date de l’événement, avec quelques liens supplémentaires.
L’entité «Agent» de PREMIS est liée au «User Management LDAP», qui