Séminaire : Données de la recherche
Nature, Cultures & Valeurs
Ces 5 dernières années, les données de la recherche ont fait l’objet d’une attention croissante de la part des gouvernements et des institutions scientifiques, visant à augmenter leur partage, leur interopérabilité, leur standardisation et leur mise en visibilité. Des outils et processus de gestion, de stockage et de conservation, de FAIRisation, de traçabilité, d’analyse, d’archivage, etc., ont été développés pour répondre à l’accroissement de la connaissance et des découvertes, mais aussi pour contribuer à l’intégrité scientifique. La donnée étant aujourd’hui plus que jamais considérée comme ayant un potentiel de création de multiples valeurs — scientifique, politique, économique, environnementale, etc.
Récemment, au sein des institutions de recherche, une expression a fait son apparition pour qualifier le nécessaire passage à une gestion vertueuse des données : « l’acculturation à la donnée ». Or, s’il est des acteurs de la recherche dont la culture (voire, même la nature), est justement de produire et de gérer, de manière adéquate, des données qui soient les plus performantes et utiles, il s’agit bien des chercheurs et des ingénieurs…
En opérant un « retour disciplinaire » à la donnée, ce séminaire souhaite redonner la parole à un certain nombre de communautés disciplinaires de recherche, avec pour objectif de dépasser le risque de tension et de dualité qui pourrait s’immiscer entre recherche et gestion, entre scientifique et technicien, entre données et outils.
Les thématiques et les intervenants exposeront ainsi la manière dont leurs écosystèmes disciplinaires collaborent pour cultiver, consciemment ou inconsciemment, explicitement ou implicitement, une culture de la donnée qui réunit, depuis longtemps, science et gestion.
Une donnée ne naît pas « donnée », elle le devient dès lors qu’un acteur de la recherche la collecte, l’analyse et l’interprète, et ce dans le cadre d’un certain contexte disciplinaire, voir dans un certain contexte socio-historique. Qu’elles soient matérielles ou numériques, les données se voient attribuées des valeurs dont la variabilité peut dépendre de leur qualité, de leur quantité, de leur finalité, de leur âge, de leur stade d’élaboration (données brutes, achevées, d’observation, achevées…)
Dans tous les cas, c’est bien la communauté disciplinaire seule qui est la plus à même de déterminer la ou les valeurs de leurs données, leur classification, et leur éventuelle hiérarchisation.
Les différentes communautés de la recherche qui participeront au séminaire viendront présenter ce qui, selon elles et à l’aune de leur discipline, confèrent à certaines de leurs données une valeur primordiale et prioritaire par apport à d’autres données.
Ainsi, les thématiques suivantes seront abordées au travers d’exposé ou de tables rondes :
COORDINATION SCIENTIFIQUE
Françoise Gaill Ocean Sustainability Fondation OSF/ CNRS Fondation |
Guigone Camus Chercheur indépendant |
Christophe Calvin CEA |
DATE & LIEU
18 octobre 2023
9h00 - 17h15
Sorbonne Université – Institut de l’Océan
Barre 44 – 54
1er étage – salle 109
Accès par la Tour 44
4 place Jussieu
75005 Paris
SITUATION
Organisateurs et partenaires
PROGRAMME
08h50 – 09h15
Accueil
09h15 – 09h30
Introduction
Les données de valeur média de transfert de connaissance
09h30 – 10h00
Exploitation d’un patrimoine de connaissances
FAIRisation des données des essais
Olivier Musseau
CEA
10h00 – 10h30
Données de santé – données longitudinales
Julien Thevenon
CHU Grenoble
10h30 – 11h00
Data Terra: E-Infrastructure for observational data (spatiales, sols, in-situ) and information to monitor, understand and integrated modelling of the Earth system and environment
Jean-Pierre Vilotte
CNRS
11h00 – 11h20
Pause
Les données observationnelles et expérimentales
11h20 – 12h05
Table Ronde
Jean-Marc Delvit
Federico Ferri
Gérald Carrier
CNES
CEA/CERN
ONERA
12h05 – 13h35
Déjeuner libre
Coût des données (environnement et économique)
13h35 – 14h05
Coût des données : regard d’un chercheur
Cécile Callou
MNHN
Les données transdisciplinaires : environnement et océan
14h05 – 14h50
Table Ronde
Christophe Prazuck
Catherine Schmechtig
Eric Goberville
Anouk Barberousse
Frédérique Chlous
Théophile Bongarts
CNRS, ECCE TERRA
Sorbonne Université
IHPST, Sorbonne Université
MNHN
Plateforme Océan & Climat
Les données d’aide à la prévention / prévision / décision
14h50 – 15h20
L’expérience Obépine : de la recherche à la prise de décision
Vincent Maréchal
Sorbonne Université
15h20 – 15h50
Données, risque, urgence environnementale : priorité à la fiabilité
Anouk Barberousse
Sorbonne Université, ITE,
en partenariat avec l’INERIS
15h50 – 16h20
Données océanographiques : contribution TotalEnergies à la communauté internationale
Eric Cauquil
TotalEnergies
16h20 – 16h40
Pause
Les données sensibles / sécurité des données
16h40 – 17h25
Synthèse des débats de la journée
Elise Dufour
Cabinet Bignon-Lebray
17h25 – 17h35
Françoise Gaill
Guigone Camus
Christophe Calvin
Résumé de la présentation
Matin – Partie 1
Après-midi – Partie 2
Exploitation d'un patrimoine de connaissances - FAIRisation des données des essais | Olivier Musseau
Après l’arrêt définitif de ses essais nucléaires, la France a lancé en avril 1996 le programme Simulation. Celui ci s’appuie sur le référentiel des résultats de mesure des essais nucléaires passés, avec la mise en œuvre de principes FAIR pour la gestion de ces données.
Olivier Musseau – Responsable d’un programme de gestion des connaissances
Je suis ingénieur Supélec et docteur en physique de l’université Paris XI Orsay. Au CEA (Commissariat à l’Energie Atomique) j’ai travaillé une quinzaine d’années en microélectronique (avec plus de 40 publications scientifiques).
En 2001 j’ai rejoint la DRH pour construire des projets de gestion des compétences (GPEC) dans deux directions du CEA. Depuis 2017 je suis en charge de la gestion des connaissances.
Données de santé longitudinales pour la recherche : Exemple des maladies rares | Julien Thevenon
En France, le diagnostic et la prise en charge des maladies rares est un enjeu de santé publique pris en compte à travers plusieurs actions nationales et européennes, fédérées dans un Plan National Maladies Rares. La modélisation de la connaissance médicale dans les maladies rares et la collecte de données de santé centralisées permet d’accumuler une connaissance collective importante pour le diagnostic et le pronostic des maladies rares. Une bonne connaissance des histoires naturelles d’un groupe de patients porteurs d’une maladie rare est difficile à atteindre et la constitution de larges jeux de données longitudinaux est important. Nous détaillerons les éléments organisationnels nationaux, existants et structurés à travers les plan nationaux maladies rares successifs.
Julien Thevenon est généticien médical au CHU Grenoble-Alpes, responsable du service Génétique, Génomique et Procréation et en charge des analyses de génomique constitutionnelles pour la plateforme AURAGEN du Plan France Médecine Génomique 2025. Au sein de l’Université Grenoble-Alpes, il coordonne une équipe de recherche ‘Génomique Translationnelle’ comprenant une chaire IA appliquée à la santé dans l’institut Interdisciplinaire d’Intelligence Artificielle en santé.
Data Terra: electronic infrastructure for observation data | F. Huynh & Jean-Pierre Vilotte (CNRS-INSU)
We present here the national research E-infrastructure Data Terra its services for managing, discovering, assessing and cross-analysing multi-source and multi-type observational data of the different domains of the Earth system and environment and their interactions, and how it supports disciplinary and interdisciplinary science and societal challenges, in particular related with climate changes and extreme environmental events.
Dr. Jean-Pierre Vilotte (orcid.org/0000-0002-6085-6498), PhD, HDR, is Professor at the Institut de Physique du Globe de Paris (IPGP, CNRS-UMR 7154), and Scientific Deputy at the CNRS-INSU for High-Performance Computing & Data Analysis, AI/ML, Fair Data and Open Science. In 2015, he was awarded Fellow of the American Geophysical Union.
He is actively involved in the French PEPR program (CNRS-CEA,INRIA) Numerics for Exascale (NumPEx) in which he is scientific coordinator of the Exa-DI project focussing on co-design, co-development and integration of expanded application-driven Exascale software stack.
He has an international expertise in mathematical and computational geophysics, at the interface between mathematics, statistical physics, computational and data sciences.
Table Ronde : Les données observationnelles et expérimentales
Jean-Marc DELVIT – Coordinateur Technique – Campus de la Donnée du CNES
Jean-Marc Delvit a obtenu son doctorat en traitement du signal et des images à Supaéro, France, en 2003.
Il a ensuite travaillé pour l’agence spatiale française (CNES) dans le domaine de l’observation de la Terre spatiale à très haute résolution (SPOT, Pléiades, CO3D, Hélios, CSO…).
En 2018, il a développé le laboratoire d’observation de la Terre du CNES en charge des applications utilisant les données spatiales, en étroite collaboration avec l’ensemble des utilisateurs finaux (institutionnels, privés, recherche et défense).
Depuis 2022, il assure la coordination technique du campus de la donnée du CNES, sous-direction en charge de l’ensemble des données spatiales du CNES, de la déspatialisation à lutilisation finale.
Ses domaines d’intérêt sont le traitement d’images, en particulier les questions de photogrammétrie, l’hybridation des données en observation de la Terre, l’extraction d’informations et les jumeaux numériques terrestres appliqués à différentes thématiques (littoral, risque, urbain, bassin versant, zones spécifiques…).
Physicien des particules à l’Irfu, CEA Paris-Saclay, Federico Ferri a obtenu son doctorat auprès de l’Ecole Polytechnique Palaiseau et de l’Université de Milano-Bicocca, et son HDR auprès de Sorbonne Université. Membre de l’expérience CMS au LHC du CERN, il a participé aux analyses de qui ont mené à la découverte du boson de Higgs en 2012 et a été adjoint et ensuite chef de projet du calorimètre électromagnétique de l’CMS de 2017 à 2021. Depuis 2021 il s’occupe activement aussi des ressources pour la grille de calcul de l’Irfu du CEA Paris-Saclay.
Gérald Carrier
Diplômé de l’école Centrale Paris avec une spécialisation en Aéronautique. Rejoint l’ONERA en 2000 comme ingénieur en aérodynamique appliquée puis devient responsable d’une unité de recherche applicative traitant de l’aérodynamique des avions de transport. Depuis 2022, il est adjoint scientifique et technique de la Direction des Souffleries qui gère le parc des grandes souffleries industrielles de l’ONERA.
Coût des données (environnement et économique) : regard d'un chercheur | Cécile Callou
Coût de production des données, valeur scientifique ou économique, bénéfice pour la Société, mais aussi impact des pratiques du numérique sur l’environnement, tout se mêle et s’entre-mêle jusqu’à interroger aujourd’hui nos pratiques de chercheurs.
Maître de conférences du Muséum national d’Histoire naturelle, archéozoologue spécialiste des périodes historiques dans l’unité « Archéozoologie, archéobotanique : sociétés, pratiques et environnements (AASPE) », Cécile Callou est également responsable scientifique de collection dans l’ensemble Vertébrés.
Depuis 2011, Cécile Callou est également directrice de l’unité d’appui et de recherche CNRS/MNHN « Bases de données sur la Biodiversité, Écologie, Environnement et Sociétés (BBEES) »
Table Ronde : Les données transdisciplinaires : environnement et océan
Catherine Schmechtig a obtenu son doctorat en 2000. Elle est ingénieur de recherche au CNRS depuis 2002. Depuis 2011, elle gère des données de biogéochimie hauturières du programme national LEFE-CYBER de l’INSU, elle est également co-chair de la gestion de données biogéochimiques du programme international Argo.
« Argo » est un programme international qui coordonne la collecte des informations à l’intérieur de l’océan à l’aide d’une flotte d’instruments robotisés. Ces instruments, les flotteurs profileurs, dérivent avec les courants océaniques et se déplacent à la verticale entre la surface et 2000m, 4000m ou le fond des océans.
Eric Goberville est enseignant chercheur à Sorbonne Université et au laboratoire BOREA (Biologie des Organismes et des Écosystèmes Aquatiques). Spécialisé dans l’étude des réponses de la biodiversité aux influences climatiques et anthropiques, ses recherches couvrent diverses échelles géographiques et temporelles, avec trois objectifs principaux :
Caractériser la diversité des écosystèmes en termes de fonctionnement et de structure.
Définir et quantifier les interactions complexes entre le climat, l’environnement et la biologie.
Créer des modèles pour prévoir les réponses écologiques de certaines espèces clés face aux pressions environnementales passées et futures, comme les déplacements géographiques, les risques d’extinction et la sensibilité aux perturbations.
Cette démarche de recherche repose sur l’analyse de données de suivi et d’observation, l’application de concepts écologiques, ainsi que le développement et l’utilisation de méthodes numériques et statistiques.
Page web du laboratoire: https://borea.mnhn.fr/fr/users/eric-goberville
Anouk Barberousse est professeure de philosophie des sciences à Sorbonne Université et dirige l’Institut de la Transition Environnementale de l’Alliance Sorbonne Université.
Frédérique Chlous – Professeure d’anthropologie
Directrice du département Homme et Environnement
Muséum national d’Histoire naturelle, Paris
Ses recherches portent sur les relations entre humains et environnement, plus spécifiquement sur les milieux marins et côtiers, dans une perspective d’anthropologie sociale et culturelle. Les travaux menés concernent les savoirs, les savoir-faire, les représentations sociales de l’environnement et également les formes de gouvernance des espaces naturels incluant les parties prenantes. Les démarches participatives sont expérimentées et analysées, celles-ci permettent d’intégrer la diversité des relations que les habitants tissent avec leur environnement, les processus de patrimonialisation et de discuter des formes de gestion.
Théophile Bongarts-Lebbe est diplômé d’un master en politiques économiques et développement agricole de l’Université Panthéon-Sorbonne. Au sein de la Plateforme Océan & Climat, il a d’abord participé à la coordination des activités scientifiques, et notamment à la révision du rapport du GIEC dédié à l’océan et la cryosphère (le SROCC) pour les gouvernements français et monégasques. Il a ensuite collaboré à la préparation de la COP25 en assistant l’initiative Because the Ocean. Depuis quatre ans, il coordonne le projet Sea »ties dédié à l’adaptation des villes côtières confrontées à l’élévation du niveau de la mer.
L’expérience Obépine : de la recherche à la prise de décision | Vincent Maréchal
Obépine (Observatoire Épidémiologique dans les eaux usées) est un consortium de recherche français réunissant des experts en virologie médicale, biologie moléculaire, génomique, microbiologie environnementale, hydrologie et modélisation mathématique. Obépine vise à développer des projets de recherche innovants (modèles épidémiologiques, analyse des variants dans les eaux usées, nouveaux systèmes d’échantillonnage actifs et passifs) et à produire des données utiles aux décideurs politiques dans le cadre de leur soutien à la gestion de crise. Obépine a été leader dans la mise en place de systèmes de surveillance de l’épidémie de COVID-19 via les eaux usées et a assuré le déploiement d’un réseau national de surveillance du SARS-CoV-2 dans les eaux usées dans 200 stations d’épuration, couvrant 40% de la population française, depuis l’été 2020 jusqu’à avril 2022. L’intervention évoquera les conditions de déploiement du réseau Obépine et soulignera différents aspects de la relation entre recherche et aide à la prise de décision, en situation de crise et dans la construction de plans de surveillance et de prévention pérennes.
Vincent Maréchal est Professeur de Virologie à Sorbonne Université, où il a dirigé l’UFR des Sciences de la vie de 2015 et 2020.
Il est co-fondateur de plusieurs initiatives de recherche sur la COVID-19 dont le réseau OBEPINE (suivi du SARS-CoV2 dans les eaux usées dans le cadre d’un plan de lutte intégrée contre le COVID-19), qu’il dirige depuis septembre 2021. Il est également porteur d’un projet de plateforme nationale de détection et de suivi des infections émergentes à travers l’analyse des eaux usées, projet déposé dans le cadre du plan France 2030.
Données, risque, urgence environnementale : priorité à la fiabilité | Anouk Barberousse
Les données utilisées pour prévenir les risques industriels, y compris ceux causés par les changements globaux, sont collectées par une multitude d’acteurs (ingénieurs, techniciens, agents de maintenance). Leur efficacité en matière de prévention dépend non seulement de leur harmonisation mais également de la capacité des acteurs à saisir les enjeux de cet effort collectif. Ainsi, le pouvoir de ces données hétérogènes en matière de prévention des risques dépend des procédures organisationnelles destinées à en garantir la fiabilité et de la capacité des institutions à faire évoluer ces procédures.
Anouk Barberousse est professeure de philosophie des sciences à Sorbonne Université et dirige l’Institut de la Transition Environnementale de l’Alliance Sorbonne Université.
Données océanographiques : contribution TotalEnergies à la communauté internationale | Eric Cauquil
TotalEnergies acquière des données océanographiques très diverses (géologie de surface, océanographie physique, météorologie, biologie) dans le cadre des études d’explorations et de développements pétroliers et éoliens en mer. Des protocoles de mises à disposition des communautés scientifiques de certaines de ces données existent depuis un certain temps via des réseaux internationaux tels que GBIF (Global Biodiversity Information Facility) et SIMORC (System of Industry Metocean data for the Offshore and Research Communities). Plus récemment, TotalEnergies a rejoint le Corporate Data Group du programme Ocean Decade de l’UNESCO pour définir avec d’autres partenaires industriels un cadre de transfert d’autres types de données du domaine privé vers les institutions internationales.
Eric Cauquil est diplômé d’un doctorat en Sciences de la Terre de l’Université Paris VI. Il a conduit pratiquement toute sa carrière au sein du groupe TotalEnergies ou il occupe aujourd’hui une position d’expert en géologie marine, reconnaissance des sites et évaluation des aléas géologiques. Il est le représentant de TotalEnergies au sein du Corporate Data Group de l’initiative Ocean Decade menée par l’Unesco.
Synthèse des débats de la journée | Elise Dufour
L’intervention vise à synthétiser les échanges de la journée sur les questions d’exploitation et de valorisation de la donnée personnelle et de la donnée brute
Spécialiste en droit des nouvelles technologies, Elise Dufour accompagne une clientèle française et internationale dans leurs projets numériques.
Ses principaux domaines de compétences, tant en conseil qu’en contentieux, sont le suivi des projets informatique (Cloud computing, Intelligence artificielle, Saas, Open source), la valorisation et la sécurisation des données collectées (personnelles et non personnelles), la stratégie en transformation digitale, la défense de l’actif immatériel d’une entreprise sur internet (e-réputation, politique AdWords, stratégie en matière de noms de domaine et de nouvelles extensions, récupération de noms de domaine). Et plus généralement, l’accompagnement de tout projet e-commerce envisagé (sur site internet mais aussi sur application mobile).
Elise Dufour est Présidente de l’association Cyberlex depuis 2016. Elle est également Experte Parl .fr par l’OMPI. Elle est par ailleurs certifiée Data Protection Officer.
En 2022, Elise est référencée par les classements d’avocats majeurs en IP et IT : Legal 500, Palmarès du Droit, WTR 1000.