Outils et corpus
LES THÈMES ABORDÉS
L’objectif de ce sous-groupe est d’une part de recenser des corpus de fichiers pouvant être réutilisés et d’autre part d’élaborer un registre sur les différents outils qui servent de près ou de loin à la préservation numérique.
Les corpus de fichiers sont un élément essentiel pour pouvoir mener des tests sur les différents outils. En effet, pouvoir refaire, avec les mêmes points de départ, des expérimentations est un prérequis pour une démarche scientifique fiable et transparente. De plus, ces corpus fixes permettent les comparaisons à la fois entre les différents outils mais aussi dans le temps.
Par ailleurs, les outils utilisés pour la préservation numérique sont nombreux et interviennent à différentes étapes du cycle de vie de la préservation. Pour pouvoir les catégoriser, nous nous sommes appuyés sur les catégories fonctionnelles du wiki COPTR (Community Owned digital Preservation Tool Registry) issues du DCC Curation Lifecycle Model.
Afin d’offrir un outil évolutif et directement utilisable par un public francophone, notre démarche s’est inscrite dans la base de connaissances Wikidata. Celle-ci permet d’associer, de manière structurée, à chaque élément une liste de faits sourcés, ainsi que des références externes.
Ce travail de recensement est en cours et absolument pas exhaustif. Dans un premier temps, nous proposons une série de requêtes sur cette base permettant de retrouver facilement l’information disponible et de rebondir vers d’autres bases de connaissances plus textuelle (Wikipedia, PRONOM, …).
PUBLICATIONS
INVENTAIRE DES CORPUS DE FICHIERS
CATÉGORISATION DES OUTILS
REQUÊTES EXEMPLES SUR WIKIDATA
Liste des étapes du cycle de vie | https://w.wiki/N5r |
Liste des processus associés aux étapes | https://w.wiki/r83 |
Lite des outils associés à l’étape « Créer ou Réceptionner » | https://w.wiki/r8B |
Liste des outils associés à l’étape « Verser » | https://w.wiki/r88 |
Liste des outils associés à l’étape « Stocker » | https://w.wiki/r8C |