Connaissez-vous le « projet valise » ? C’est l’histoire d’une équipe de chercheurs en physique des particules qui souhaite analyser les données d’une expérience vingt ans plus tard avec de nouveaux outils et découvrent ces données enregistrées sur de vieilles bandes magnétiques, elles-mêmes stockées dans une vieille valise oubliée dans le recoin d’un bureau. S’ensuit un laborieux travail de récupération, de lecture et de compréhension des données.
Fort heureusement, l’histoire se termine bien, et les chercheurs découvrent même une nouvelle dépendance de l’énergie dans les interactions fondamentales. Mais il n’en va pas de même pour toutes les tentatives de recherche incluant des données anciennes. Il est courant de se trouver face à des supports anciens inutilisables faute de machine en état de les lire ou, pire, de ne pas du tout retrouver les données car elles ont tout simplement été jetées une fois le projet terminé et les articles publiés.
À mesure que les instruments et les outils d’analyse se perfectionnent, la quasi-totalité des disciplines fait face à une explosion du volume de données produites chaque année. Et ces données sont précieuses, car elles sont très souvent issues d’expériences complexes et coûteuses comme en physique des hautes énergies, ou sont le fruit d’observations ponctuelles sur une longue période de temps à l’instar du suivi de la position des objets stellaires ou des relevés démographiques.
C’est dans ce contexte qu’est né en 2012 le projet interdisciplinaire Predon, sous l’impulsion de Cristinel Diaconu, directeur de recherche au CNRS1 : « L’explosion du volume de données issues des expériences menées au Cern nous a conduits à mener une réflexion autour de leur préservation. Nous avons dans un premier temps st...
[Courte citation de 8% de l'article original]