L’agence de certification cascad et le CASD proposent en partenariat une procédure pour attester de la reproductibilité d’une recherche sur des données confidentielles. La certification cascad-CASD permet aux chercheurs de signaler auprès de leurs pairs le caractère reproductible de leur recherche sur des données confidentielles hébergées au CASD.
cascad est une structure d’appui à la recherche (UMS CNRS 2007), sans but lucratif, financée par différentes institutions françaises dont le CNRS, HEC Paris et l’Université d’Orléans.
La certification sur données confidentielles garantit la reproductibilité des résultats numériques (tableaux et graphiques) d’une publication scientifique, à partir d’un ensemble de ressources numériques (codes informatiques et données confidentielles ) utilisées par le chercheur.
Le partenariat entre le CASD et cascad vise à établir des environnements sécurisés de certification permettant à un rapporteur spécialisé d’exécuter le code sur les données confidentielles précisément identifiées (sources, produits, version, DOI). Le comité du secret statistique et les producteurs de données ont accueilli favorablement cette initiative et nous les en remercions très chaleureusement.
Un pilote est en cours. Le CASD permettra l’accès du certificateur en mettant à disposition des environnements spécifiques pour chaque demande, uniquement le temps de la certification pour les données concernées.
Si vous souhaitez participer à ce pilote :
- Contactez le CASD;
- Fournissez le code organisé, votre manuscrit en format pdf ainsi qu’un fichier readme. Ce fichier doit contenir les noms et affiliations des chercheurs qui participent au projet, le journal (en cas d’articles publiés ou à paraitre), la liste des bases de données sources du CASD, le(s) langage(s) de programmation et les librairies requises pour faire fonctionner le code ainsi que leurs versions. Il doit également indiquer la logique du code : y-a-t-il un masterfile qui exécute l’intégralité du code, ou alors plusieurs fichiers qu’il faut lancer dans un ordre bien précis ? Quels sont ceux fournissant les résultats à certifier ?
- Le code doit être commenté de telle sorte qu’il soit facile à comprendre pour le rapporteur cascad effectuant la certification. Les variables doivent avoir le même nom dans le code et dans l’article. A défaut, un glossaire doit être fourni dans le readme.
- Les certifications seront gratuites pour les chercheurs, à raison d’une demande par projet mené sur le CASD. La procédure de certification dure au maximum 15 jours (sauf cas particulier). Les certifications sont réalisées par du personnel de l’agence cascad dûment accrédité par le comité du secret statistique.
- A l’issue de la procédure de certification, un certificat de reproductibilité est envoyé à l’auteur. Sauf contre-indication, le code et l’article seront déposés sur la plateforme d’archives ouvertes Zenodo, où un DOI leur sera attribué.
Coût : gratuit (les certifications seront gratuites pour les chercheurs, financées par le CASD et cascad, à raison d’une demande par projet mené sur le CASD.)
Délai : environ 15 jours
Auditeurs/certificateurs : personnel de cascad ayant signé un engagement de confidentialité (en particulier en PI)