Stocker ses données
Afin d’en assurer la sécurité, il est essentiel d’anticiper le stockage de ses données de recherche. Assurer les conditions optimales pour stocker vos données permet de faciliter leur récupération en cas de perte (disque dur abîmé, format obsolète...) et de renforcer leur sécurité tout au long de vos activités de recherche, jusqu’à leur archivage, y compris dans le cadre d'un travail collaboratif nécessitant un espace commun sécurisé.
A ce titre, le stockage des données implique de mettre en œuvre différentes actions concrètes : sécuriser les droits d’accès à vos données, les sélectionner, les organiser et les documenter, en planifier la sauvegarde, estimer la volumétrie, mais aussi prévoir le financement de ce stockage ainsi que renforcer votre vigilance concernant les données personnelles et sensibles et adapter le cas échéant vos espaces de travail numériques*.
Les ressources sélectionnées par l’équipe de CoDataSorb vous permettront de comprendre, pas à pas, comment mettre en œuvre des pratiques de stockage des données de recherche vertueuses et sécurisées.
Grâce à ces ressources, vous serez en mesure de comprendre les enjeux et objectifs du stockage des données et d'appliquer les recommandations en matière d'organisation et de sécurité de votre environnement de travail. Vous serez également aptes à prendre en main les espaces de travail et outils collaboratifs sécurisés, les services proposés spécifiquement pour le stockage des données en ALL-SHS (ShareDocs, Huma-Num Box) ainsi que l'environnement de travail conçu pour l'accès à certaines données sensibles (SD Box).
Vous pourrez aussi poursuivre votre autoformation via des sites de références ou encore solliciter des personnes-ressources pour vous accompagner au mieux dans le stockage de vos données de recherche.
*Exemples d'actions issus de la vidéo de l'Inist-CNRS “La minute stockage et archivage pérenne”.
Stocker ses données de recherche : définitions et enjeux
Le stockage des données de recherche permet de garantir la continuité d'exploitation des données tout au long du projet de recherche, au sein d'un environnement sécurisé. Si elles sont complémentaires au stockage, la documentation des données ainsi que leur conservation au sens d'un archivage pérenne, s'en distinguent. Anticipées dès la planification de la gestion de ses données notamment dans un plan de gestion de données (PGD), les conditions de stockage sont garantes de la sécurité de vos données.
Après que les données aient été documentées et constituées en jeux de données diffusables, il est possible de les déposer dans un entrepôt de données, afin de les préserver, les signaler et les visibiliser, ainsi que les partager. Pour plus d'information sur ces pratiques, consulter la rubrique "Exposer ses données".
-
Stocker ses données : les ressources essentielles
Le stockage des données de recherche se différencie d'autres types de fonctions telles que le partage des données ou encore la conservation et l'archivage pérenne, qui poursuivent chacun des objectifs différents, bien que complémentaires au sein du cycle de vie des données.
DoRANum et sa vidéo "La minute : Stockage et archivage pérenne"
L'Inist-CNRS met à disposition une vidéo de quelques minutes expliquant la différence entre deux étapes importantes du cycle de vie des données, le stockage et l'archivage pérenne.DoRANum, "Stockage, partage et archivage : quelles différences ?"
L'Inist-CNRS propose un poster interactif sur les fonctions distinctes du stockage, du partage et de l'archivage pérenne des données tout au long de leur cycle de vie.Stockage et sécurité des données : conditions et pratiques essentielles
En étant anticipées, les conditions de stockage des données de recherche peuvent être assurées par un ensemble de pratiques vertueuses en matière d'organisation et de sécurité de l'environnement de travail.
DoRANum, "Stocker ses données de façon sécurisée"
Cet article synthétique de l'Urfist Méditerranée et l'Inist-CNRS revient sur les conditions de stockage sécurisé, garant essentiel de la protection des données : les avantages et inconvénients de différents supports de stockage, la règle des 3-2-1 pour mettre en œuvre une sécurité physique, les moyens à disposition pour apporter une sécurité informatique aux données.DoRANum, "Séminaire sur le stockage des données de la recherche"
La Cellule DATA Grenoble Alpes, avec la contribution de l'Urfist de Lyon et de l'Inist-CNRS met à disposition le webinaire dédié au stockage des données de recherche. Structuré par différents chapitres thématiques autour du stockage, ce séminaire permet de revenir sur la définition et les enjeux du stockage des données, sur la réglementation associée, sur les recommandations d'organisation, ou encore sur l'anticipation et le déploiement du stockage dans le cadre plus général d'un Plan de gestion de données (PGD).DoRANum, "Stockage et archivage - Quelles données conserver et comment ?"
Pour aller plus loin sur ces enjeux, DoRANum met à disposition de nombreuses ressources constamment réactualisées (fiches, vidéos, guides, autoévaluation...) autour des pratiques vertueuses et sécurisées du stockage des données de recherche.
Partager et travailler sur ses données dans un environnement de travail sécurisé adapté aux données SHS
Les projets de recherche en ALL-SHS peuvent requérir des attentions particulières en matière de stockage des données de recherche : travailler autour de ses données avec des collaborateurs variés, assurer leur stockage sur des outils conçus spécifiquement pour ces disciplines, veiller aux conditions de sécurité des données personnelles et sensibles susceptibles d'être mobilisées dans ses activités de recherche. À ces fins, différents services et outils sont à votre disposition tels que les espaces de travail collaboratifs sécurisés, les services de l'Infrastructure de recherche étoile Huma-Num, ou encore le rôle du Centre d’accès sécurisé aux données (CASD) pour le travail sur des données sensibles dans un environnement sécurisé. Il est par ailleurs recommandé d'utiliser prioritairement un espace de stockage institutionnel sécurisé, et certaines universités et organismes, partenaires des établissements de Sorbonne Alliance, proposent de tels services.
À noter que les procédures d'accès aux données sont diverses selon les services pourvoyeurs de données de recherche (Progedo pour des données quantitatives en SHS, Centre de données socio-politiques (CASD) des données issues d'enquêtes par questionnaires...) : pour plus d'informations, consulter la rubrique dédiée à la collecte des données de recherche en SHS.
De plus, pour réduire les risques de perte de données et gagner du temps pour (ré)utiliser ses données stockées dans l'environnement de travail sécurisé, un ensemble de bonnes pratiques en matière d'organisation et de structuration des fichiers peuvent être mises en œuvre (règles de nommage, plan de classement et arborescence hiérarchisée, standards de métadonnées).
Pour plus d'informations sur ces pratiques, consulter la rubrique "Documenter ses données".
Enfin, après que les données aient été documentées et constituées en jeux de données diffusables, il est possible de les déposer dans un entrepôt de données. Le dépôt dans un entrepôt permet tout à la fois de les préserver, les signaler et les visibiliser, ainsi que les partager (auprès de vos pairs, en liant vos jeux de données à une publication, etc). Pour plus d'informations sur ces pratiques, consulter la rubrique "Exposer ses données".
-
Les espaces de travail collaboratifs sécurisés nationaux et internationaux
Diversifiés, les espaces de travail collaboratifs sécurisés sont essentiels pour centraliser ses fichiers de travail, en garantissant de la sorte les bonnes conditions de gestion et de partage tout au long de ses activités de recherche.
DoRANum, "Les espaces de travail collaboratifs sécurisés"
L'Institut français de bioinformatique et le centre de ressources DoRANum propose un guide interactif sur les espaces de travail collaboratifs sécurisés à la disposition des acteurs de la recherche. Le guide revient sur l'importance de tels espaces et leurs fonctionnalités communes, avant de détailler deux exemples, Resana et NextCloud (fonctionnement, atouts et limites, cas concrets d'utilisation).Des environnements de travail collaboratifs sécurisés : quelques espaces de stockage sécurisés nationaux et internationaux
Zoom sur trois services sécurisés de stockage des données de recherche : la plateforme nationale Resana, l'espace de stockage national Fichiers et le cloud européen File Sync and Share.
SPOTE, "Resana : plateforme collaborative interministérielle pour vos groupes de travail"
Resana est une plateforme collaborative à destination des agents de l'Etat. Elle met à disposition un espace numérique de stockage, de partage et de coédition de documents, ainsi que d'autres fonctionnalités facilitant le travail collaboratif (planification de tâches, gestion de projet, agenda partagé, messagerie instantanée...). Il s'agit d'un service interministériel déployé par la Direction interministérielle du numérique (DINUM), lié à la fédération d'authentification Renater.LaSuite et l'outil national Fichiers
Fichiers est l'espace de stockage national issu des outils numériques de LaSuite. Fichiers est conçu pour stocker les fichiers et dossiers, permettant également de travailler de manière collaborative. Ce service est lié à la fédération d'authentification Renater.European Open Science Cloud (EOSC) et son cloud sécurisé "File Sync and Share"
File Sync and Share est un service d'EOSC de stockage sécurisé en cloud. Il offre ainsi la possibilité de partager des fichiers au sein d'un environnement de travail sécurisé. Des outils de prise en main sont proposés sur le site (tutoriels, documentation).Un outil sécurisé de transfert de fichiers
Zoom sur un service national de transfert sécurisé de fichiers volumineux : FileSender.
FileSender, un outil de transfert sécurisé pour les fichiers volumineux
À destination de la communauté de l'Enseignement supérieur et de la recherche, FileSender est un service de transfert sécurisé de fichiers volumineux. Il met à disposition un espace de stockage temporaire permettant d'échanger de fichiers volumineux entre personnels des établissements et organismes membres de la communauté avec leurs interlocuteurs privilégiés. FileSender peut être utilisé par l'ensemble des établissements connectés à Renater. Des outils de prise en main sont proposés sur le site (FAQ, guide utilisateur, tutoriels, documentation). -
Les services d'Huma-Num pour le stockage sécurisé des données SHS : ShareDocs et Huma-Num Box
L'Infrastructure de recherche étoile (IR*) Huma-Num à destination des sciences humaines et sociales propose plusieurs outils numériques pour ces disciplines, dont deux dédiés au stockage des données dans un environnement sécurisé : ShareDocs et Huma-Num Box, ces deux services répondant à des besoins spécifiques. Comme pour tous les outils d'Huma-Num, un compte HumanID doit être créé avant de pouvoir demander l'accès à ces services.
Le stockage des données dans ShareDocs
Proposé par Huma-Num, ShareDocs est un service de stockage et un gestionnaire de fichiers à destination de la communauté SHS. Mis en œuvre sur ses propres serveurs et déporté en ligne sur le réseau recherche français public, le stockage de ShareDocs permet plusieurs fonctionnalités avancées conçues autour de la gestion des données de recherche en SHS (préparation de fichier pour une édition en ligne ou une diffusion sur l'entrepôt Nakala, cryptage des données, organisation des fichiers ainsi que leur enrichissement, etc).
ShareDocs est conçu pour être utilisé pour les données chaudes (durant le temps du projet), et n'a pas vocation à archiver les données du projet de recherche.
Huma-Num et son guide utilisateur "ShareDocs : Présentation, fonctionnement et utilisation"
Proposé par Huma-Num, ce guide pratique permet de prendre en main ShareDocs et ses différentes fonctionnalités : conditions d'accès, visualisation et gestion des fichiers, affichage et édition des fichiers, partage des fichiers et dossiers, compte projet ShareDocs...Huma-Num et sa vidéo sur le service Sharedocs
Sous l'angle de la collecte des données, ce webinaire d'Huma-Num présente les fonctionnalités de son service ShareDocs.Le stockage des données dans Huma-Num Box
Conçu par Huma-Num pour les SHS, le service Huma-Num Box a pour objectif de faciliter le stockage, la sécurisation et la gestion des jeux de données de recherche volumineux. Huma-Num Box est conçu pour être utilisé pour les données tièdes/froides (ainsi mises à l'abri, pouvant dépasser le temps du projet mais sans procédure de pérennisation et de conservation).
Huma-Num et son guide utilisateur, "Huma-Num Box : stockage sécurisé pour données tièdes et froides"
Proposé par Huma-Num, ce guide pratique permet de prendre en main Huma-Num Box et ses différentes fonctionnalités : conditions d'accès, caractéristiques des données accueillies par ce dispositif, limitations techniques.Le carnet Hypothèses d'Huma-Num, "La Huma-Num Box : vers un stockage distribué en réseau pour les SHS"
Cet article du carnet d'Hypothèses d'Huma-Num synthétise les caractéristiques du service Huma-Num Box.Pour aller plus loin sur les services de stockage des données d’Huma-Num
Université Grenoble Alpes et la présentation "Les solutions de stockage chez Huma-Num : ShareDocs et Huma-Num Box"
Mis à disposition par l'université Grenoble Alpes, le webinaire "Sauvegarder, stocker ses données durant un projet : avec quels outils ?" revient sur différents enjeux et préconisations, parmi lesquelles les solutions de stockage proposées par Huma-Num, ShareDocs et Huma-Num Box (à partir de 40 minutes 25, présentation de 20 minutes). Sont ainsi abordés pour ces deux services différents éléments : les fonctionnalités proposées, les types et volumes de données qui y sont stockées, les durées d'utilisation, les destinataires de ces outils, les dispositifs de sécurité qui y sont déployés, les procédures pour y avoir accès, la gestion du stockage une fois le projet de recherche mené à son terme. -
L’environnement de travail pour les données sensibles issues de la statistique publique depuis le Centre d'Accès Sécurisé aux Données (CASD)
Exigeant un haut niveau de sécurité, les données personnelles et sensibles de nombreuses institutions de statistiques publiques peuvent être consultées via la SD Box, un équipement sécurisé dédié. Conçu par le Centre d'Accès Sécurisé aux Données (CASD), ce boîtier autonome payant permet de garantir la confidentialité et l'intégralité des données. Grâce à ce dispositif, "l’ensemble des données est confiné dans un environnement sécurisé où chaque projet dispose d’un serveur virtuel permettant aux utilisateurs d’accéder et d’exploiter les données sans qu’à aucun moment ils ne puissent les extraire sous quelque forme que ce soit"*.
Le CASD fait partie des dispositifs permettant d'accéder à des données protégées issues de la statistique publique, en passant par des procédures d'habilitation devant le Comité du secret statistique (CSS).*citation extraite du guide du CASD
CASD, présentation de la SD Box pour l'accès aux données sensibles
Cette présentation proposée par le CASD revient sur l'infrastructure développée pour assurer l'accès sécurisé aux données sensibles issues de la statistique publique ainsi que sur le boîtier SD Box qui permet d'accéder à l'environnement de travail.CASD, guide utilisateur de la SD Box
Le guide utilisateur de la SD Box proposé par le CASD revient sur les informations nécessaires pour mettre en œuvre le projet de recherche au sein de l'environnement de travail sécurisé : conditions préalables avant utilisation, accès aux données, conditions de sécurité, fin d'abonnement ou de projet, citation des données et publications.CASD, guide pour l'application des règles de confidentialité et d'anonymisation des données
Proposé par le CASD, ce guide revient sur "les principes d'anonymisation et des règles de confidentialité à appliquer pour exporter des fichiers" depuis l'environnement de travail sécurisé de la SD Box. A ce titre, il détaille "les différents types de secret applicables (statistiques, fiscal, etc) et les différentes obligations liées aux cadres juridiques de l'accès aux données (RGPD, Loi Informatique et Liberté)". -
Les espaces institutionnels de stockage des partenaires des établissements de Sorbonne Alliance
Afin de travailler dans un environnement de travail sécurisé tout au long de son projet de recherche, il est recommandé d'utiliser prioritairement un espace de stockage institutionnel sécurisé. Certaines universités et organismes, partenaires des établissements de Sorbonne Alliance, proposent de tels services.
sDrive, l'espace de stockage institutionnel pour les laboratoires rattachés au CNRS
sDrive fait partie des Offres de services numériques aux laboratoires du CNRS. A ce titre, sDrive est l'espace de stockage institutionnel pour les laboratoires rattachés au CNRS, et pour le cas des établissements de CoDataSorb les Unités mixtes de recherche (UMR). Les fonctionnalités sont multiples : espace jusqu’à 100 Go, synchronisation automatique, édition de documents en ligne, capacité de partage volumineux, accès sécurisé et protégé.DropSu, l'espace de stockage pour les laboratoires rattachés à Sorbonne Université
DropSU est le service de stockage de documents de Sorbonne Université. Dans le cas des établissements de Sorbonne Alliance, cet espace de stockage est accessible pour les unités de recherche en cotutelle avec Sorbonne Université. DropSU vous offre la possibilité "de créer, importer, modifier, stocker et/ou partager des documents ou des données" ainsi que de travailler de manière collaborative (traitement de texte, tableurs, présentation...).NextCloud, l'espace de stockage pour les laboratoires rattachés à Paris Cité
NextCloud est le service de stockage de documents de Paris Cité. Dans le cas des établissements de Sorbonne Alliance, cet espace de stockage est accessible pour les unités de recherche en cotutelle avec Paris Cité. Cet espace est "adapté pour le stockage, le partage et le traitement de données de type tableurs ou fichiers texte".IRD Drive, l'espace de stockage pour les laboratoires rattachés à l'IRD
IRD Drive est le service de stockage de documents de l'Institut de Recherche pour le Développement (IRD). Dans le cas des établissements de Sorbonne Alliance, cet espace de stockage est accessible pour les unités de recherche en cotutelle avec l'IRD. Cet espace permet de "stocker et partager des fichiers allant jusqu'à une dizaine de gigaoctets" et dispose "d'un éditeur en ligne permettant la collaboration sur des documents, des tableurs et des présentations".
Contacts
Une seule adresse mail générique à retenir pour contacter CoDataSorb, l'Atelier de la donnée de Sorbonne Alliance : codatasorb@sorbonne-alliance.fr