Ouvrir dans votre navigateur si ce message ne s'affiche pas correctement
 
N°57
MAI 2023
 
 
 
Titre
édito
 
5 ans après l’entrée en vigueur du RGPD
 
Le janvier 2018, dans une tribune du magazine Variance, le CASD présentait les grands changements à venir introduit par le Règlement européen sur la protection des données personnelles (RGPD). Largement compatible avec la loi Informatique et libertés, il n’en opère pas moins des changements d’importance en décrivant notamment les points suivants :

• La portée européenne des obligations de protection des données
• La responsabilisation des acteurs et leurs obligations de sécurité renforcée en contrepartie d’une simplification des démarches (fin des déclarations préalables ou demandes d’autorisation, sauf dans certains domaines sensibles tels que celui de la santé)
• L’obligation, pour les traitements les plus sensibles, de réaliser une Analyse d’Impact de la Protection des Données (AIPD)
• L’implication du sous-traitant dans la chaine des responsabilités

Depuis, on a vu partout mises en œuvre les dispositions qui accompagnent ce règlement (comme la mise en place des Délégués à la protection des données (DPD), les registres de traitement…)

5 ans après son entrée en application, le RGPD est maintenant un puissant outil de protection des données pour l’Union européenne (UE) et ses États membres, cité comme modèle à l’international. Les principes d’éthique édictés par ce règlement (finalités, transparence, information, droit, sécurité, minimisation, consentement…) s’appliquent en tout lieu pour protéger l’usage des données des citoyens européens par les organismes privés (plateformes, réseaux sociaux..) ou publics. Cette protection est devenue indispensable car l’usage de ces données ne fait que croître.

La Commission nationale de l'informatique et des libertés (CNIL), en France, accompagne les projets de recherche ou d’étude statistique dans leurs démarches de mise en conformité. La CNIL exerce aussi sa mission de contrôle en concertation avec les autres autorités de contrôle européennes. C’est ainsi que régulièrement des sanctions sont prononcées à l’égard des organismes qui ne respectent pas les principes du RGPD et ces sanctions sont d’autant plus fortes qu’elles sont portées pour l’ensemble des pays membres de l’UE et sont largement relayées par la presse.

 
zoom
SPARK & PARQUET pour de gros volumes de données
L’outil Spark est devenu incontournable pour le traitement de gros volumes de données.

Depuis quelques années, le CASD met Spark à disposition des utilisateurs pour faciliter le traitement distribué sur de gros volumes de données. Le premier cluster Spark a été mis en place au CASD en 2015 et rassemblait 30 nœuds dans le cadre du projet Teralab.

Aujourd’hui la plupart des projets employant Spark au CASD utilisent Python (via PySpark) ou R (via Sparklyr ou SparkR) et le format de données Parquet. Ce dernier, en organisant les données en colonne, permet d’en optimiser la compression qui est assurée par défaut. Concrètement, pour un fichier de données de 730 millions de lignes, l’espace de stockage nécessaire en fonction du format :

• CSV : 417 Giga octets
• SAS : 311 Giga octets
• PARQUET : 24 Giga octets

Cette compression peut être associée à un partitionnement pertinent des données pour accélérer les traitements par la suite, en particulier lorsque ces traitements s’opèrent sur des colonnes tout en minimisant l’utilisation des ressources disques et mémoire.


Actualités
Expert Workshop avec les utilisateurs de IDAN (International Data Access Network)
Le réseau de centres sécurisés dont le CASD est partenaire a tenu une réunion le 22 mai avec une quinzaine de chercheurs pour discuter de leurs besoins en matière d’accès transnational aux données confidentielles. [En savoir plus]
22-23 mai : Visite d'études du FORS au CASD
FORS, le centre de compétences suisse en sciences sociales, qui étudie la possibilité d'accueillir des données confidentielles dans sa banque de données pour la recherche est venu rencontrer les équipes du CASD pour mieux en comprendre le fonctionnement d'ensemble. [En savoir plus]
Assemblée générale des membres du GIP CASD
Elle aura lieu le 22 juin 2023. Plus d’informations sur l’Assemblée générale, la gouvernance et les missions du CASD sur notre site.
 
Quelques publications récentes
Ex post Analysis of the Crop Diversification Measure of CAP Greening in France - SAUQUET A.
European Review of Agricultural Economics
[En savoir plus]
Cross-Border Labour Mobility Decisions: The Effect of Complementarities in Local Labour Markets DUMEIGNIL C., LESUEUR JY., SABATIER M.
Economics Bulletin John P. Conley vol. 41, issue 3
[En savoir plus]
Le rôle de la branche après les ordonnances Macron : entre permanence et renouvellement - DELAHAIE N., FRETEL A., PETIT H., FARVAQUE N., et al.
La Revue de l’IRES, n° 107-108, 2022/2-3
[En savoir plus]
Voir plus de publications >
 
Quelques nouveaux projets
Pratiques de prévention des risques psychosociaux en entreprises et santé des salariés
mené par Stéphanie BOINI, Institut National de Recherche et de Sécurité et al.
[En savoir plus sur le projet]
Financement des start-ups deeptechs et spin-offs académiques
mené par Benjamin LE PENDEVEN, Ecole Supérieure de Commerce Audencia Nantes et al.
[En savoir plus sur le projet]
Sexualité après un cancer du sein : données de vie réelle à partir de la cohorte Constances
mené par Delphine HEQUET, Institut Curie et al.
[En savoir plus sur le projet]
La pollution de l’air et la productivité du travail : une analyse empirique sur données française
mené par Clara KOEGEL, Centre d'Économie de la Sorbonne
[En savoir plus sur le projet]
Voir plus de projets >
 
international
 
 
16-20 juillet 2023
64th International Statistical Institute (ISI) World Statistics Congress
Ottawa, CANADA
[En savoir plus…]
26-28 septembre 2023
UNECE expert meeting on Statistical Data Confidentiality 2023
Wiesbaden, ALLEMAGNE
[En savoir plus…]
 
 
AGENDA
 
 
 
Les prochaines séances d’enrôlement
auront lieu :
 
3 juillet 2023
s’inscrire >
 
 
24 juillet 2023
s’inscrire >
 
Les prochaines séances du comité du secret
statistique auront lieu :
9 juin 2023
(Consultation électronique : demandes complémentaires)
Date limite de dépôt des dossiers :
(inscriptions closes)
7 juillet 2023
(Consultation électronique : demandes complémentaires)
Date limite de dépôt des dossiers :
20 juin 2023
 
13 juin 2023
(Séance : nouveaux projets)
Date limite de dépôt des dossiers :
(inscriptions closes)
Retrouvez toutes les dates des prochaines consultations du Comité du secret statistique
 
Nouvelles données disponibles
Fichier panel des contribuables à l'Impôt sur la Fortune et à l'Impôt sur la Fortune Immobilière (ISF-IFI), 2018-2022 - Ministère des Finances (DGFiP)
Le Fichier ISF-IFI contient des informations sur les déclarations des foyers fiscaux soumis aux ISF-IFI.
Données mensuelles de TVA, 2023-04 - Ministère des Finances (DGFiP)
Données mensuelles de TVA
Minima sociaux, droits d'assurance chômage et parcours salariés (MIDAS), 2023T1 - DARES
MIDAS croise les données de contrats salariés dans les MMO (DARES), l'indemnisation des demandeurs d'emploi (Pôle Emploi) et les bénéficiaires de minima sociaux (CNAF).
Dispositif FORCE (Formation, Chômage et Emploi), 2023T1 - Ministère du Travail (DARES)
Appariement des fichiers historiques des demandeurs d'emploi, des Mouvements de Main d'oeuvres, du fichier BREST (Formation professionnelle) et du fichier I-MILO (Suivis dans les missions locales).
Contrats d'apprentissage, 2012-2021 - Ministère du Travail (DARES)
Ces données portent sur les contrats d'apprentissage et de professionnalisation, leurs bénéficiaires, les établissements utilisateurs et les tuteurs.
Bases 2022 des données du PMSI (Programme de Médicalisation des Systèmes d'Information) - ATIH
MCO (Médecine, chirurgie, obstétrique et odontologie), SSR (Soins de suite ou de réadaptation), HAD (Hospitalisation à domicile), PSY (Psychiatrie)
Commerce extérieur : Importations/Exportations et Echanges commerciaux inter DOM et DOM-France métropolitaine, 2017-2022 - Direction générale des Douanes et Droits indirects (DGDDI)
Introductions/Expéditions et données extracommunautaires
Inscriptions formations post-baccalauréat des établissements du 2nd degré (BPBAC), 2021 - SIES
Inscriptions dans les formations post-baccalauréat dispensées dans les établissements publics et privés du second degré
Enquête sur la commercialisation des logements neufs (ECLN), 2023T1 - Ministère de l'Environnement (SDES)
Enquête trimestrielle assurant le suivi de la commercialisation des logements neufs destinés à la vente
Etablissements et Services pour Personnes Handicapées (ES-PH), 2018 - DREES
L’enquête ES-PH porte sur l’activité des établissements et services pour personnes handicapées, leurs personnels et le profil des enfants et adultes accueillis dans ces structures.
Etablissements d'Hébergement pour Personnes Agées (EHPA), 2003, 2007 et 2011 - DREES
L’enquête EHPA apporte des informations sur l’activité des établissements hébergeant des personnes âgées, son personnel et les personnes âgées qui y résident.
Enquête Vie Quotidienne et Santé (VQS), 2021 Ministère de la Santé (DREES)
Conditions de vie des seniors, difficultés à réaliser les activités de la vie quotidienne et aides reçues
Base inter-administrative annuelle des ESMS (BADIANE), 2019 - Ministère de la Santé (DREES)
C'est un fichier à vocation d’études et de recherches, rassemblant des informations relatives aux structures médico-sociales.
Echantillon Interrégimes de Cotisants (EIC), 2001, 2005 et 2009 - Ministère de la Santé (DREES)
Il permet d'étudier les droits à la retraite acquis. Couplé avec l'EIR, il permet aussi d'analyser les passages de l'emploi à la retraite et de réaliser des projections.
Echantillon Interrégimes de cotisants apparié avec les données de Pôle Emploi (EIC apparié Pôle Emploi), 2001, 2005, 2009, 2013 et 2017 - DREES
Dans le cas de cette source, l’EIC a été apparié avec les données de Pôle Emploi.
Echantillon Interrégimes de Cotisants apparié avec le Panel tous actifs de l’INSEE, 2001, 2005, 2009, 2013 et 2017 - Ministère de la Santé (DREES)
Dans le cas de cette source, l’EIC a été apparié avec les données du Panel tous actifs de l’INSEE.
Echantillon Interrégimes de Cotisants apparié avec l’Echantillon Démographique Permanent (EIC apparié EDP), 2009, 2013 et 2017 - DREES
Dans le cas de cette source, l’EIC a été apparié avec les données de l’Echantillon Démographique Permanent.
Echantillon inter-régimes de retraités apparié avec les données issues du panel tous actifs (EIR apparié panel tous actifs), 2012 - DREES
L’EIR permet d’observer l’évolution du nombre et de la composition des retraités, conditions de départ et de montant moyen de pension par retraité.
 
Données bientôt disponibles
Enquête sur le Coût de la Main d'Oeuvre et la Structure des Salaires (ECMOSS), 2019 et 2020 INSEE
Elle a pour objectif la production de statistiques structurelles sur le coût de la main-d’œuvre et les salaires.
 
Titre
se désabonner  >
Voir toutes les newsletters >
Logo   Logo   Logo   Logo   Logo   Logo   Logo