Stage - Bac+4/+5 - Performances de modèles d'apprentissage avec la prédiction conforme - H/F

Détail de l'offre

Informations générales

Entité de rattachement

La Direction des Applications Militaires (DAM) du CEA, au cœur des enjeux de la dissuasion nucléaire Française, cherche ses futurs talents. Organisme inclusif, le CEA est handi-accueillant : nos emplois sont ouverts à toutes et tous. Associer les forces et les compétences de chacun pour atteindre nos objectifs est l'une de nos valeurs partagée par nos 4 600 salariés, répartis sur 5 centres. Les 1 800 salariés du centre de Bruyères-le-Châtel, en Ile de France relèvent les défis scientifiques et technologiques au service de notre Sécurité Nationale. Le centre conçoit les charges nucléaires des armes de la dissuasion, garantit leur sécurité et leur fiabilité en s'appuyant sur le programme simulation. Il met son expertise technique au service des activités dans la lutte contre la prolifération nucléaire, le terrorisme et les alertes en cas de séisme ou de tsunami. Il assure l'ingénierie des infrastructures complexes de la DAM, de leur conception à leur démantèlement. Il co-développe avec Atos les supercalculateurs au meilleur niveau mondial, dont sont issus ceux du Très Grand Centre de Calcul du CEA, qu'il exploite pour ses missions Défense et gère au profit de la recherche. Enfin, il exploite les installations nécessaires au maintien en condition opérationnelle et à la conception des chaufferies nucléaires embarquées sur les sous-marin et les porte-avions.
Venez-vous investir et relever des défis avec des moyens technologiques d'exception!  

Référence

2024-33078-S1392  

Description du poste

Domaine

Mathématiques, information  scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

Stage - Bac+4/+5 - Performances de modèles d'apprentissage avec la prédiction conforme - H/F

Sujet de stage

La simulation numérique est devenue un outil incontournable en recherche et développement en créant un pont entre la théorie et l’expérience. Elle s’appuie sur des outils, appelés codes de calcul, capables de décrire et de prédire des phénomènes complexes. Ces codes sont composés de paramètres d’entrée représentant l’état du système et délivrent en sortie des réponses le caractérisant. La conception et la garantie d’un système nécessitent un grand nombre d’appels au code de calcul, dont l’exécution peut être coûteuse en temps de calcul. Il devient alors indispensable de disposer d’un modèle de substitution, appelé métamodèle, plus simple, plus rapide et fidèle au phénomène étudié. Ce modèle peut être construit, à partir d'un nombre limité de simulations, par différentes méthodes d'apprentissage supervisé. Néamoins, il devra être capable de prédire tout en associant une confiance à cette prédiction.

Durée du contrat (en mois)

5-6 mois

Description de l'offre

Ce stage relève de l'apprentissage supervisé et des statistiques. L'objectif est de s'approprier la méthode dite de prédiction conforme (aussi appelée inférence conforme) et de l'utiliser avec différents types de modèles d'apprentissage. Malgré les performances impressionnantes dans les tâches prédictives, en pratique il peut être difficile d'attacher de la confiance à la sortie de ces modèles. La prédiction conforme propose de garantir une précision aux prédictions faites avec un modèle d'apprentissage, sans faire d’hypothèse sur la distribution des données. Cette approche permet ainsi de construire des ensembles de prédiction de confiance avec un taux d'erreur garanti. Il est possible d’utiliser la prédiction conforme avec n'importe quel modèle pré-entraîné (tel qu'un réseau de neurones, une régression par processus Gaussien, une régression linéaire, un SVM, etc.) pour produire des ensembles dont on garantit qu'ils contiennent la véritable prédiction visée avec une probabilité spécifiée (90% par exemple)
Le stage se déroulera de la manière suivante. Une première partie sera une étude bibliographique afin de se familiariser avec les techniques de prédiction conforme [1]. Cette étude bibliographique se déroulera en parallèle d’une implémentation afin d’en acquérir une compréhension plus fine. Une deuxième partie sera consacrée à la mise en œuvre sur différents cas tests et à partir de différents modèles d’apprentissage. L’approche pourra être utilisée sur des modèles fournissant par nature une incertitude associée aux prédictions de type régression par processus gaussien afin d’identifier le gain de la prédiction conforme. Enfin, les problèmes ouverts et verrous techniques et numériques pourront être soulevés et investigués dans une dernière partie.
[1] A Gentle Introduction to Conformal Prediction and Distribution-Free Uncertainty Quantification, A. N. Angelopoulos and S. Bates https://arxiv.org/pdf/2107.07511.pdf

Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes en situation de handicap, cet emploi est ouvert à tous et toutes. Participant à la protection nationale, une enquête administrative est réalisée pour tous les salariés du CEA afin d'assurer l'intégrité et la sécurité de la nation.

Profil du candidat

probabilités, statistiques, machine learning, Python, R
Bac+4/+5

Localisation du poste

Site

DAM Île-de-France

Localisation du poste

France, Ile-de-France, Essonne (91)

Ville

Bruyères-le-Châtel