A la croisée des révolutions numériques

Generic selectors
Exact matches only
Search in title
Search in content
Generic selectors
Exact matches only
Search in title
Search in content
Home 5 Évènement 5 Séminaire : Données de la recherche

Séminaire : Données de la recherche

Nature, Cultures & Valeurs

Les chercheurs sont des producteurs de données nécessaires à l’énoncé de faits scientifiques et techniques, quelle que soit la discipline concernée.

Ces 5 dernières années, les données de la recherche ont fait l’objet d’une attention croissante de la part des gouvernements et des institutions scientifiques, visant à augmenter leur partage, leur interopérabilité, leur standardisation et leur mise en visibilité. Des outils et processus de gestion, de stockage et de conservation, de FAIRisation, de traçabilité, d’analyse, d’archivage, etc., ont été développés pour répondre à l’accroissement de la connaissance et des découvertes, mais aussi pour contribuer à l’intégrité scientifique. La donnée étant aujourd’hui plus que jamais considérée comme ayant un potentiel de création de multiples valeurs — scientifique, politique, économique, environnementale, etc.

Récemment, au sein des institutions de recherche, une expression a fait son apparition pour qualifier le nécessaire passage à une gestion vertueuse des données : « l’acculturation à la donnée ». Or, s’il est des acteurs de la recherche dont la culture (voire, même la nature), est justement de produire et de gérer, de manière adéquate, des données qui soient les plus performantes et utiles, il s’agit bien des chercheurs et des ingénieurs…

En opérant un « retour disciplinaire » à la donnée, ce séminaire souhaite redonner la parole à un certain nombre de communautés disciplinaires de recherche, avec pour objectif de dépasser le risque de tension et de dualité qui pourrait s’immiscer entre recherche et gestion, entre scientifique et technicien, entre données et outils.

Les thématiques et les intervenants exposeront ainsi la manière dont leurs écosystèmes disciplinaires collaborent pour cultiver, consciemment ou inconsciemment, explicitement ou implicitement, une culture de la donnée qui réunit, depuis longtemps, science et gestion.

Une donnée ne naît pas « donnée », elle le devient dès lors qu’un acteur de la recherche la collecte, l’analyse et l’interprète, et ce dans le cadre d’un certain contexte disciplinaire, voir dans un certain contexte socio-historique. Qu’elles soient matérielles ou numériques, les données se voient attribuées des valeurs dont la variabilité peut dépendre de leur qualité, de leur quantité, de leur finalité, de leur âge, de leur stade d’élaboration (données brutes, achevées, d’observation, achevées…)

Dans tous les cas, c’est bien la communauté disciplinaire seule qui est la plus à même de déterminer la ou les valeurs de leurs données, leur classification, et leur éventuelle hiérarchisation.

Les différentes communautés de la recherche qui participeront au séminaire viendront présenter ce qui, selon elles et à l’aune de leur discipline, confèrent à certaines de leurs données une valeur primordiale et prioritaire par apport à d’autres données.

Ainsi, les thématiques suivantes seront abordées au travers d’exposé ou de tables rondes :

  • Les données de valeur média de transfert de connaissance
  • Les données observationnelles de la découverte et de la compréhension / données expérimentales pour validation/qualification
  • Coût des données (environnement et économique)
  • Les données transdisciplinaires de valeur sociétales et historiques
  • Les données d’aide à la prévention / prévision / décision
  • Les données sensibles et la sécurité des données
  • COORDINATION SCIENTIFIQUE

         

    Françoise Gaill

    Ocean Sustainability Fondation

    OSF/ CNRS Fondation

    Guigone Camus

    Chercheur indépendant

    Christophe Calvin

    CEA

    DATE & LIEU

    18 octobre 2023

    9h00 - 17h15

    Sorbonne Université – Institut de l’Océan

    Barre 44 – 54
    1er étage – salle 109
    Accès par la Tour 44

    4 place Jussieu
    75005 Paris

    SITUATION

    Organisateurs et partenaires

    PROGRAMME

    08h50 – 09h15

    Accueil

    09h15 – 09h30

    Introduction

    Les données de valeur média de transfert de connaissance

    09h30 – 10h00

    Exploitation d’un patrimoine de connaissances
    FAIRisation des données des essais

    Olivier Musseau

    CEA

    10h00 – 10h30

    Données de santé – données longitudinales

    Julien Thevenon

    CHU Grenoble

    10h30 – 11h00

    Data Terra: E-Infrastructure for  observational data (spatiales, sols, in-situ) and information to monitor, understand and integrated modelling  of the Earth system and environment 

    Jean-Pierre Vilotte

    CNRS

    11h00 – 11h20

    Pause

    Les données observationnelles et expérimentales

    11h20 – 12h05

    Table Ronde

    Jean-Marc Delvit
    Federico Ferri
    Gérald Carrier

    CNES
    CEA/CERN
    ONERA

    12h05 – 13h35

    Déjeuner libre

    Coût des données (environnement et économique)

    13h35 – 14h05

    Coût des données : regard d’un chercheur

    Cécile Callou

    MNHN

    Les données transdisciplinaires : environnement et océan

    14h05 – 14h50

    Table Ronde

    Christophe Prazuck
    Catherine Schmechtig
    Eric Goberville
    Anouk Barberousse
    Frédérique Chlous
    Théophile Bongarts

    Institut de l’Océan
    CNRS, ECCE TERRA
    Sorbonne Université
    IHPST, Sorbonne Université
    MNHN
    Plateforme Océan & Climat

    Les données d’aide à la prévention / prévision / décision 

    14h50 – 15h20

    L’expérience Obépine : de la recherche à la prise de décision

    Vincent Maréchal

    Sorbonne Université

    15h20 – 15h50

    Données, risque, urgence environnementale : priorité à la fiabilité

    Anouk Barberousse

    Sorbonne Université, ITE,
    en partenariat avec l’INERIS

    15h50 – 16h20

    Données océanographiques : contribution TotalEnergies à la communauté internationale

    Eric Cauquil

    TotalEnergies

    16h20 – 16h40

    Pause

    Les données sensibles / sécurité des données

    16h40 – 17h25

    Synthèse des débats de la journée

    Elise Dufour

    Cabinet Bignon-Lebray

    17h25 – 17h35

    Conclusion

    Françoise Gaill
    Guigone Camus
    Christophe Calvin

    Résumé de la présentation

    Matin – Partie 1

    Après-midi – Partie 2

    Exploitation d'un patrimoine de connaissances - FAIRisation des données des essais | Olivier Musseau

    Après l’arrêt définitif de ses essais nucléaires, la France a lancé en avril 1996 le programme Simulation. Celui ci s’appuie sur le référentiel des résultats de mesure des essais nucléaires passés, avec la mise en œuvre de principes FAIR pour la gestion de ces données.

    Olivier Musseau – Responsable d’un programme de gestion des connaissances

    Je suis ingénieur Supélec et docteur en physique de l’université Paris XI Orsay. Au CEA (Commissariat à l’Energie Atomique) j’ai travaillé une quinzaine d’années en microélectronique (avec plus de 40 publications scientifiques).
    En 2001 j’ai rejoint la DRH pour construire des projets de gestion des compétences (GPEC) dans deux directions du CEA. Depuis 2017 je suis en charge de la gestion des connaissances.

    Données de santé longitudinales pour la recherche : Exemple des maladies rares | Julien Thevenon

    En France, le diagnostic et la prise en charge des maladies rares est un enjeu de santé publique pris en compte à travers plusieurs actions nationales et européennes, fédérées dans un Plan National Maladies Rares. La modélisation de la connaissance médicale dans les maladies rares et la collecte de données de santé centralisées permet d’accumuler une connaissance collective importante pour le diagnostic et le pronostic des maladies rares. Une bonne connaissance des histoires naturelles d’un groupe de patients porteurs d’une maladie rare est difficile à atteindre et la constitution de larges jeux de données longitudinaux est important. Nous détaillerons les éléments organisationnels nationaux, existants et structurés à travers les plan nationaux maladies rares successifs.

    Julien Thevenon est généticien médical au CHU Grenoble-Alpes, responsable du service Génétique, Génomique et Procréation et en charge des analyses de génomique constitutionnelles pour la plateforme AURAGEN du Plan France Médecine Génomique 2025. Au sein de l’Université Grenoble-Alpes, il coordonne une équipe de recherche ‘Génomique Translationnelle’ comprenant une chaire IA appliquée à la santé dans l’institut Interdisciplinaire d’Intelligence Artificielle en santé.

    Data Terra: electronic infrastructure for observation data | F. Huynh & Jean-Pierre Vilotte (CNRS-INSU)

    We present here the national research E-infrastructure Data Terra its services for managing, discovering, assessing and cross-analysing multi-source and multi-type observational data of the different domains of the Earth system and environment and their interactions, and how it supports disciplinary and interdisciplinary science and societal challenges, in particular related with climate changes and extreme environmental events.

    Dr. Jean-Pierre Vilotte (orcid.org/0000-0002-6085-6498), PhD, HDR, is Professor at the Institut de Physique du Globe de Paris (IPGP, CNRS-UMR 7154), and  Scientific Deputy at the CNRS-INSU for High-Performance Computing & Data Analysis, AI/ML, Fair Data and Open Science. In 2015, he was awarded Fellow of the American Geophysical Union.
    He is actively involved in the French PEPR program (CNRS-CEA,INRIA) Numerics for Exascale (NumPEx) in which he is scientific coordinator of the Exa-DI project focussing on co-design, co-development and integration of expanded application-driven Exascale software stack.
    He has an international expertise in mathematical and computational geophysics, at the interface between mathematics, statistical physics, computational and data sciences.

    Table Ronde : Les données observationnelles et expérimentales

    Jean-Marc DELVIT – Coordinateur Technique – Campus de la Donnée du CNES
    Jean-Marc Delvit a obtenu son doctorat en traitement du signal et des images à Supaéro, France, en 2003.
    Il a ensuite travaillé pour l’agence spatiale française (CNES) dans le domaine de l’observation de la Terre spatiale à très haute résolution (SPOT, Pléiades, CO3D, Hélios, CSO…).
    En 2018, il a développé le laboratoire d’observation de la Terre du CNES en charge des applications utilisant les données spatiales, en étroite collaboration avec l’ensemble des utilisateurs finaux (institutionnels, privés, recherche et défense).
    Depuis 2022, il assure la coordination technique du campus de la donnée du CNES, sous-direction en charge de l’ensemble des données spatiales du CNES, de la déspatialisation à lutilisation finale.
    Ses domaines d’intérêt sont le traitement d’images, en particulier les questions de photogrammétrie, l’hybridation des données en observation de la Terre, l’extraction d’informations et les jumeaux numériques terrestres appliqués à différentes thématiques (littoral, risque, urbain, bassin versant, zones spécifiques…).


    Physicien des particules à l’Irfu, CEA Paris-Saclay, Federico Ferri a obtenu son doctorat auprès de l’Ecole Polytechnique Palaiseau et de l’Université de Milano-Bicocca, et son HDR auprès de Sorbonne Université. Membre de l’expérience CMS au LHC du CERN, il a participé aux analyses de qui ont mené à la découverte du boson de Higgs en 2012 et a été adjoint et ensuite chef de projet du calorimètre électromagnétique de l’CMS de 2017 à 2021. Depuis 2021 il s’occupe activement aussi des ressources pour la grille de calcul de l’Irfu du CEA Paris-Saclay.

     

     


    Gérald Carrier

    Diplômé de l’école Centrale Paris avec une spécialisation en Aéronautique. Rejoint l’ONERA en 2000 comme ingénieur en aérodynamique appliquée puis devient responsable d’une unité de recherche applicative traitant de l’aérodynamique des avions de transport. Depuis 2022, il est adjoint scientifique et technique de la Direction des Souffleries qui gère le parc des grandes souffleries industrielles de l’ONERA.

     

     


     

    Coût des données (environnement et économique) : regard d'un chercheur | Cécile Callou

    Coût de production des données, valeur scientifique ou économique, bénéfice pour la Société, mais aussi impact des pratiques du numérique sur l’environnement, tout se mêle et s’entre-mêle jusqu’à interroger aujourd’hui nos pratiques de chercheurs.

    Maître de conférences du Muséum national d’Histoire naturelle, archéozoologue spécialiste des périodes historiques dans l’unité « Archéozoologie, archéobotanique : sociétés, pratiques et environnements (AASPE) », Cécile Callou est également responsable scientifique de collection dans l’ensemble Vertébrés.
    Depuis 2011, Cécile Callou est également directrice de l’unité d’appui et de recherche CNRS/MNHN « Bases de données sur la Biodiversité, Écologie, Environnement et Sociétés (BBEES) » 

    Table Ronde : Les données transdisciplinaires : environnement et océan

    Catherine Schmechtig a obtenu son doctorat en 2000. Elle est ingénieur de recherche au CNRS depuis 2002. Depuis 2011, elle gère des données de biogéochimie hauturières du programme national LEFE-CYBER de l’INSU, elle est également co-chair de la gestion de données biogéochimiques du programme international Argo.

    « Argo » est un programme international qui coordonne la collecte des informations à l’intérieur de l’océan à l’aide d’une flotte d’instruments robotisés. Ces instruments, les flotteurs profileurs, dérivent avec les courants océaniques et se déplacent à la verticale entre la surface et 2000m, 4000m ou le fond des océans.


    Eric Goberville est enseignant chercheur à Sorbonne Université et au laboratoire BOREA (Biologie des Organismes et des Écosystèmes Aquatiques). Spécialisé dans l’étude des réponses de la biodiversité aux influences climatiques et anthropiques, ses recherches couvrent diverses échelles géographiques et temporelles, avec trois objectifs principaux :

    Caractériser la diversité des écosystèmes en termes de fonctionnement et de structure.
    Définir et quantifier les interactions complexes entre le climat, l’environnement et la biologie.
    Créer des modèles pour prévoir les réponses écologiques de certaines espèces clés face aux pressions environnementales passées et futures, comme les déplacements géographiques, les risques d’extinction et la sensibilité aux perturbations.
    Cette démarche de recherche repose sur l’analyse de données de suivi et d’observation, l’application de concepts écologiques, ainsi que le développement et l’utilisation de méthodes numériques et statistiques.

    Page web du laboratoire: https://borea.mnhn.fr/fr/users/eric-goberville


    Anouk Barberousse est professeure de philosophie des sciences à Sorbonne Université et dirige l’Institut de la Transition Environnementale de l’Alliance Sorbonne Université.


    Frédérique Chlous – Professeure d’anthropologie
    Directrice du département Homme et Environnement
    Muséum national d’Histoire naturelle, Paris

    Ses recherches portent sur les relations entre humains et environnement, plus spécifiquement sur les milieux marins et côtiers, dans une perspective d’anthropologie sociale et culturelle. Les travaux menés concernent les savoirs, les savoir-faire, les représentations sociales de l’environnement et également les formes de gouvernance des espaces naturels incluant les parties prenantes. Les démarches participatives sont expérimentées et analysées, celles-ci permettent d’intégrer la diversité des relations que les habitants tissent avec leur environnement, les processus de patrimonialisation et de discuter des formes de gestion.

     


    Théophile Bongarts-Lebbe est diplômé d’un master en politiques économiques et développement agricole de l’Université Panthéon-Sorbonne. Au sein de la Plateforme Océan & Climat, il a d’abord participé à la coordination des activités scientifiques, et notamment à la révision du rapport du GIEC dédié à l’océan et la cryosphère (le SROCC) pour les gouvernements français et monégasques. Il a ensuite collaboré à la préparation de la COP25 en assistant l’initiative Because the Ocean. Depuis quatre ans, il coordonne le projet Sea »ties dédié à l’adaptation des villes côtières confrontées à l’élévation du niveau de la mer. 

     

     


     

    L’expérience Obépine : de la recherche à la prise de décision | Vincent Maréchal

    Obépine (Observatoire Épidémiologique dans les eaux usées) est un consortium de recherche français réunissant des experts en virologie médicale, biologie moléculaire, génomique, microbiologie environnementale, hydrologie et modélisation mathématique. Obépine vise à développer des projets de recherche innovants (modèles épidémiologiques, analyse des variants dans les eaux usées, nouveaux systèmes d’échantillonnage actifs et passifs) et à produire des données utiles aux décideurs politiques dans le cadre de leur soutien à la gestion de crise. Obépine a été leader dans la mise en place de systèmes de surveillance de l’épidémie de COVID-19 via les eaux usées et a assuré le déploiement d’un réseau national de surveillance du SARS-CoV-2 dans les eaux usées dans 200 stations d’épuration, couvrant 40% de la population française, depuis l’été 2020 jusqu’à avril 2022. L’intervention évoquera les conditions de déploiement du réseau Obépine et soulignera différents aspects de la relation entre recherche et aide à la prise de décision, en situation de crise et dans la construction de plans de surveillance et de prévention pérennes.

    Vincent Maréchal est Professeur de Virologie à Sorbonne Université, où il a dirigé l’UFR des Sciences de la vie de 2015 et 2020.
    Il est co-fondateur de plusieurs initiatives de recherche sur la COVID-19 dont le réseau OBEPINE (suivi du SARS-CoV2 dans les eaux usées dans le cadre d’un plan de lutte intégrée contre le COVID-19), qu’il dirige depuis septembre 2021. Il est également porteur d’un projet de plateforme nationale de détection et de suivi des infections émergentes à travers l’analyse des eaux usées, projet déposé dans le cadre du plan France 2030.

    Données, risque, urgence environnementale : priorité à la fiabilité | Anouk Barberousse

    Les données utilisées pour prévenir les risques industriels, y compris ceux causés par les changements globaux, sont collectées par une multitude d’acteurs (ingénieurs, techniciens, agents de maintenance). Leur efficacité en matière de prévention dépend non seulement de leur harmonisation mais également de la capacité des acteurs à saisir les enjeux de cet effort collectif. Ainsi, le pouvoir de ces données hétérogènes en matière de prévention des risques dépend des procédures organisationnelles destinées à en garantir la fiabilité et de la capacité des institutions à faire évoluer ces procédures.

    Anouk Barberousse est professeure de philosophie des sciences à Sorbonne Université et dirige l’Institut de la Transition Environnementale de l’Alliance Sorbonne Université.

    Données océanographiques : contribution TotalEnergies à la communauté internationale | Eric Cauquil

    TotalEnergies acquière des données océanographiques très diverses (géologie de surface, océanographie physique, météorologie, biologie) dans le cadre des études d’explorations et de développements pétroliers et éoliens en mer. Des protocoles de mises à disposition des communautés scientifiques de certaines de ces données existent depuis un certain temps via des réseaux internationaux tels que GBIF (Global Biodiversity Information Facility) et SIMORC (System of Industry Metocean data for the Offshore and Research Communities). Plus récemment, TotalEnergies a rejoint le Corporate Data Group du programme Ocean Decade de l’UNESCO pour définir avec d’autres partenaires industriels un cadre de transfert d’autres types de données du domaine privé vers les institutions internationales.

    Eric Cauquil est diplômé d’un doctorat en Sciences de la Terre de l’Université Paris VI. Il a conduit pratiquement toute sa carrière au sein du groupe TotalEnergies ou il occupe aujourd’hui une position d’expert en géologie marine, reconnaissance des sites et évaluation des aléas géologiques. Il est le représentant de TotalEnergies au sein du Corporate Data Group de l’initiative Ocean Decade menée par l’Unesco.

    Synthèse des débats de la journée | Elise Dufour

    L’intervention vise à synthétiser les échanges de la journée sur les questions d’exploitation et de valorisation de la donnée personnelle et de la donnée brute

    Spécialiste en droit des nouvelles technologies, Elise Dufour accompagne une clientèle française et internationale dans leurs projets numériques.​
    Ses principaux domaines de compétences, tant en conseil qu’en contentieux, sont le suivi des projets informatique (Cloud computing, Intelligence artificielle, Saas, Open source), la valorisation et la sécurisation des données collectées (personnelles et non personnelles), la stratégie en transformation digitale, la défense de l’actif immatériel d’une entreprise sur internet (e-réputation, politique AdWords, stratégie en matière de noms de domaine et de nouvelles extensions, récupération de noms de domaine). Et plus généralement, l’accompagnement de tout projet e-commerce envisagé (sur site internet mais aussi sur application mobile).​
    Elise Dufour est Présidente de l’association Cyberlex depuis 2016. Elle est également Experte Parl .fr par l’OMPI. Elle est par ailleurs certifiée Data Protection Officer.​
    En 2022, Elise est référencée par les classements d’avocats majeurs en IP et IT : Legal 500, Palmarès du Droit, WTR 1000.