Ouvrir dans votre navigateur si ce message ne s'affiche pas correctement
 
N°74
FEVRIER 2025
 
 
 
Titre
Zoom
 
Julia, un langage de plus en plus utilisé au CASD
 
Julia est un langage de programmation qui est adopté par de plus en plus de projets au CASD.

L'une des principales promesses du langage Julia est d'offrir des performances proches de celles des langages compilés comme le langage C, tout en maintenant une syntaxe claire et lisible, qui ressemble à celle d'autres langages familiers comme R et Python, avec lesquels il peut facilement s'interfacer. Il vise donc à optimiser à la fois la rapidité d'exécution et celle de rédaction du code.

Publié en open source (licence MIT), Julia dispose d'un vaste écosystème en constante évolution, avec une multitude de bibliothèques et d’outils destinés à des domaines tels que l’analyse de données, la simulation numérique, l'apprentissage automatique.

Le CASD développe des outils pour faciliter son intégration au sein des bulles CASD : mise à disposition des packages, exemples de code pour l'intégration avec R, Python, Stata et Spark.

[En savoir plus sur Julia]

 
Tech
Spark en mode cluster et mode local
Le premier webinaire sur le format de fichier parquet et l’outil d’analytics DuckDB a eu lieu le 4 février dernier et a rassemblé 305 participants.

Pour ceux qui ne pouvaient participer, nous vous joignons le lien vers le replay ainsi que le lien vers les documents supports.

Le prochain webinaire concernera spark en mode local et en mode cluster et aura lieu le 30 avril de 11h00 à 12h30.
Nous enverrons le lien pour s’inscrire dans notre prochaine newsletter.

A titre d’exemple d’application de Spark, le CASD a mis en place, dans le cadre d’un projet MIDAS de la DARES, un cluster SPARK/HDFS, permettant de distribuer les calculs au plus près des données réparties sur 15 serveurs, et qui rassemblent :
• 150 vCPU,
• 2,8 To de RAM,
• 30 To de disque brut


Data
26 mars 2025 : Présentation de données de déclaration d’impôts sur le revenu par la DGFiP
Une présentation des données de la DGFiP est prévue le mercredi 26 mars 2025 de 14h00 à 16h30.

Celle-ci fait suite à une 1ère session qui s’est déroulée en mai 2024.

Elle sera dédiée aux sources fiscales produites à partir des déclarations des foyers fiscaux.

Au programme :
• une présentation des données du fichier POTE (Déclarations d’impôt sur le revenu des foyers fiscaux),
• les Déclarations_2044 (Déclarations des revenus fonciers),
• le fichier ISF IFI, etc.

Après une 1ère partie de présentation générale de ces données et un retour sur les questions que vous avez pu nous transmettre, deux chercheuses ayant exploité les fichiers d’impôt sur le revenu de 2006 à 2022 feront une présentation de leurs travaux. La session s’achèvera par un temps d’échanges avec les producteurs.

Si vous souhaitez assister à cette session : cliquer ici.


Actualités
IDAN : mise en ligne de témoignages de chercheurs
Le site web d’IDAN vient d’être enrichi de témoignages de chercheurs utilisateurs de la Safe Room du CASD pour accéder aux données allemandes d’IAB. [Voir les témoignages]
Séminaire du CNIS : Rencontre sur les appariements de la statistique publique le 28 mai
Le séminaire rendra compte des avancées et de la manière dont le service statistique public construit un cadre aux appariements et s’organise pour les réaliser. [En savoir plus]
11 février 2025 : Le CASD à la journée « Gérer ses données sur le plateau de Saclay"
Le CASD y était présent comme infrastructure mutualisée avec deux autres retours d’expérience et un temps d’échanges avec les participants. [En savoir plus]
 
Publications récentes
The hazards of performance management: An investigation into its effects on employee absenteeism and presenteeism - BASSANINI A., BATUT C., BOUVILLE G., CAROLI E.
Human Relations, SAGE Publications [En savoir plus]
On the productivity advantage of cities - MION G., JACOB N.
Journal of Economic Geography; Volume 24, Issue 5, September 2024, Pages 679–705
[En savoir plus]
Do elections affect immigration? Evidence from French municipalities - SCHMUTZ B., VERDUGO G.
Journal of Public Economics, Volume 218, February 2023
[En savoir plus]
Voir plus de publications >
 
Les projets sur le CASD
L'allocation des patients aux professionnels de santé
mené par Philippe CHONE, GENES et al.
[En savoir plus sur le projet]
Chocs, ajustements des entreprises et protection sociale
mené par François FONTAINE, Paris School of Economics et al. [En savoir plus sur le projet]
Concentration sur le marché du travail et incidence fiscale
mené par Nina ROUSSILLE, University of California Berkeley et al. [En savoir plus sur le projet]
L'effet de la naturalisation sur le long terme
mené par Yajna GOVIND, Copenhagen Business School et al. [En savoir plus sur le projet]
Tous les projets sur le CASD >
 
international
 
 
6-7 mars 2025
9th European User Conference for EU-Microdata
Mannheim, ALLEMAGNE
[En savoir plus…]
11-13 mars 2025
New Techniques and Technologies for Statistics (NTTS2025)
Bruxelles, BELGIQUE
[En savoir plus…]
3-5 septembre 2025
European Consortium for Sociological Research (ESCR 2025)
Cologne, ALLEMAGNE
[En savoir plus…]
 
 
AGENDA
 
 
 
Les prochaines séances d’enrôlement
auront lieu :
 
10 mars 2025
s’inscrire >
 
 
14 avril 2025
s’inscrire >
 
Les prochaines séances du comité du secret
statistique auront lieu :
04 mars 2025
(Consultation électronique : demandes complémentaires)
Date limite de dépôt des dossiers :
(inscriptions closes)
03 juin 2025
(Consultation électronique : demandes complémentaires)
Date limite de dépôt des dossiers :
05 mai 2025
 
27 mars 2025
(Séance : nouveaux projets et prolongation au-delà de 8 ans)
Date limite de dépôt des dossiers :
12 mars 2025
27 mai 2025
(Séance : nouveaux projets et prolongation au-delà de 8 ans)
Date limite de dépôt des dossiers :
12 mai 2025
Retrouvez toutes les dates des prochaines consultations du Comité du secret statistique
 
Nouvelles données disponibles
Enquête sur le Coût de la Main d'Oeuvre et la Structure des Salaires (ECMOSS), 2021 et 2022 INSEE
Cette enquête a pour objectif la production de statistiques structurelles sur le coût de la main-d’œuvre et les salaires.
Sirene historique géolocalisé, 1973-2024 - INSEE
Ce fichier contient la géolocalisation des établissements du Répertoire Sirene.
Enquête Terres Labourables (TERLAB), 2024 Ministère de l'Agriculture (SSP)
Cette enquête a pour objectif d’estimer les rendements des principales cultures issues de terres labourables et l’estimation précoce de l’évolution des surfaces cultivées.
Echantillon National Interrégimes d’Allocataires de Compléments de Revenus d’Activité et de Minima Sociaux (ENIACRAMS) 2001-2023 - DREES
Evolution de la situation des individus : compléments de revenus d’activité ; minima sociaux ; chômage et emploi.
Etablissements et Services pour personnes Handicapées (ES-H), 2022 - DREES
L’enquête ES-PH porte sur l’activité des établissements et services pour personnes handicapées, leurs personnels et le profil des enfants et adultes accueillis dans ces structures.
Enquête Autonomie - volet Individus en Ménages ordinaires (ATNM-M), 2022 - DREES
Le dispositif d’enquêtes « Autonomie » a pour objectif de mesurer le nombre de personnes handicapées ou en perte d’autonomie, de décrire leurs conditions de vie.
Cotisations Foncières des Entreprises (CFE), 2024 Ministère des Finances (DGFiP)
Eléments concourant à la détermination des bases d’imposition et à l’imposition elle-même de la CFE et des dispositifs d’imposition et de taxes associés.
Acomptes et solde de l’Impôt sur les Sociétés (Mouvements_IS), 2020-2024 - DGFiP
Ce fichier rassemble les paiements des différents acomptes d’impôt sur les sociétés effectuées par les entreprises, ainsi que le solde en fin d’exercice.
Inscriptions dans les formations post-baccalauréat des établissements du second degré (BPBAC), 2023 Ministère de l'Enseignement Supérieur, de la Recherche et de l'Innovation (SIES)
Inscriptions dans les formations post-baccalauréat
Boursiers de l'enseignement supérieur (AGLAE) 2023 - SIES
L'Automatisation de la Gestion du Logement et de l’Aide à l’Etudiant - AGLAE, concerne la gestion des aides directes et indirectes attribuées aux étudiants.
Résultats aux diplômes des BTS (Enquête 24), 2022 SIES
Diplômation en BTS
Fichier statistique du casier judiciaire national, 2021 Ministère de la Justice (SSER)
Infractions, procédures de jugement, nature et quantum des peines prononcées, profil démographique des condamnés et phénomène de récidive
Fichier statistique des sortants de prison, 202408 Ministère de la Justice (SSER)
Ce fichier statistique est issu de l’appariement des fichiers Genésis sur les personnes écrouées et du fichier statistique du Casier Judiciaire National (CJN).
Enquête Vécu et ressenti en sécurité (VRS), 2022_Phase2 et 2023_Phase1 - SSMSI
L'enquête VRS succède à l'enquête Cadre de vie et sécurité pour mesurer l'insécurité ressentie et les faits de délinquance dont les individus ont pu être victimes au cours de leur vie.
 
Données bientôt disponibles
Cotisants Non Salariés du Régime Agricole (COTNS), 2023 - Mutualité Sociale Agricole (MSA)
Données sur les cotisants non-salariés agricoles issues des applications de gestion dans les caisses locales
Registre Parcellaire Graphique (RPG), 2023 - Agence de services et de paiement (ASP)
Le registre parcellaire graphique est une base de données géographiques servant de référence à l'instruction des aides de la politique agricole commune (PAC).
 
Titre
se désabonner  >
Voir toutes les newsletters >
Logo   Logo   Logo   Logo   Logo   Logo