La santé est et restera un sujet primordial de recherche scientifique, tant du point de vue médical que pour l’évaluation des politiques publiques. Depuis plusieurs années, le CASD accompagne les porteurs de projets de recherche du domaine et propose ses solutions d’environnements d’hébergement et de calcul sécurisés, adaptés aux traitements de telles données.
Actuellement, plus de 100 projets de recherche en lien avec la santé sont hébergés au sein du CASD, une soixantaine d’autres sont accompagnés dans leurs démarches préalables : circuit et cycle de vie des données, demandes d’autorisations aux autorités compétentes, réponses aux besoins en termes de capacités de calcul, etc.
Le CASD est homologué au référentiel de sécurité des données de santé, certifié Hébergeur de données de santé, et propose une solution sécurisée de bout en bout pour que l’utilisateur n’ait pas à homologuer son propre système. De ce fait, de nombreux projets au sein du CASD utilisent des données du Système national des données de santé (SNDS), comprenant les données issues de l’assurance maladie (SNIIRAM), de l’activité hospitalière (PMSI), des causes de décès ou encore des systèmes d’information sur le handicap.
Par ailleurs, l’Inserm et le CASD ont signé une convention de partenariat pour le traitement sécurisé de données de santé. La très grande cohorte épidémiologique Constances est entièrement hébergée au CASD et a déjà permis à une vingtaine d’équipes de recherche d’accéder à ses données.
Le CASD propose une grande variété d’outils de traitement de l’information : SAS, R, Python, Spark, TensorFlow, PostgreSQ… permettant d’implémenter les méthodes les plus innovantes en datascience.