Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2024-33813
Description de l'unité
Le stage se déroulera au Laboratoire d'Études et Modélisations des Systèmes, qui a pour mission de réaliser des études multiphysiques sur des systèmes nucléaires. Les compétences de ce laboratoire sont pluridisciplinaires : thermohydraulique, physique des accidents graves, énergétique, thermomécanique et statistiques.
Description du poste
Domaine
Mathématiques, information scientifique, logiciel
Contrat
Stage
Intitulé de l'offre
Stage - Machine Learning pour sorties fonctionnelles
Sujet de stage
Machine Learning pour sorties fonctionnelles : comparaison de méthodes de réduction de dimension pour variables temporelles et/ou spatiales.
Etude et développement d' approches de machine learning adaptées à des sorties temporelles et/ou spatiales, basées sur des techniques de réduction de dimension, et avec pour objectif de permettre une propagation des incertitudes en entrée des simulateurs numériques utilisés dans le laboratoire.
Durée du contrat (en mois)
6
Description de l'offre
En intégrant nos équipes, vous mettrez vos compétences et votre enthousiasme au service de projets sociétaux majeurs.
Le stage aura pour but d’étudier et développer des approches de machine learning adaptées à des sorties temporelles et/ou spatiales, basées sur des techniques de réduction de dimension, et avec pour objectif de permettre une propagation des incertitudes en entrée des simulateurs numériques utilisés dans le laboratoire.
L'analyse des accidents nucléaires pour l'évaluation des risques s'appuie fortement sur des codes informatiques permettant de simuler et prévoir les phénomènes physiques, afin d’estimer par exemple des marges de sûreté. Or, ces codes se basent sur de nombreux paramètres d'entrée incertains, conduisant à des sorties elles aussi entachées d’incertitudes. Evaluer l'impact des incertitudes associées aux paramètres d’entrée sur les résultats du simulateur numérique est donc essentielle pour l'analyse de sûreté.
Or, une propagation des incertitudes via des approches de type Monte Carlo est souvent difficilement réalisable sur les simulateurs utilisés, en raison du temps de calcul nécessaire à chaque simulation. Seul un petit nombre de simulations (plusieurs centaines à quelques milliers) est en pratique réalisable et disponible. Une approche classique est alors d’entraîner un modèle de machine learning (apprentissage statistique supervisé) sur les simulations disponibles. Ce modèle mathématique est ensuite utilisé pour réaliser les études statistiques plus gourmandes en nombre d’évaluations (propagation fine des incertitudes, analyse de sensibilité détaillée, etc.).
Dans le cadre du stage, on s’intéresse plus particulièrement aux simulateurs fournissant en sortie des variables fonctionnelles : variables temporelles et/ou spatiales, permettant de décrire le phénomène au cours du temps et/ou dans l’espace.
Tout l’enjeu est alors d’adapter les modèles de machine learning à ce type de variables. Une stratégie éprouvée consiste à réaliser une première étape de réduction de dimension de la sortie avant d’entraîner des modèles de machine learning sur chacun des coefficient de la décomposition.
L’objectif du stage sera de mettre en œuvre et comparer différentes techniques de réduction de dimension, plus ou moins complexes, telles que l’analyse en composantes principales fonctionnelle, la décomposition en ondelettes, ou encore la compression par auto-encodeur.
L’objectif sera aussi de quantifier et prendre en compte la perte d’information liée à cette réduction de dimension et d’évaluer son impact sur la prédiction du modèle de machine learning final.
Moyens / Méthodes / Logiciels
Python, R, unix, latex, git
Profil du candidat
Vous préparez un Bac+5 (Diplôme École d'Ingénieurs ou équivalents) en mathématiques appliquées et tout particulière en science des données (réduction de dimension, analyse en composantes principales).
Une expérience avec les modèles d'apprentissage statistiques, en particulier les réseaux de neurones, serait un plus.
Vous êtes à l'aise avec un environnement informatique de type Unix (linux).
La maîtrise de l'outil de suivi de version git et du langage latex seraient un plus.
Adressez-nous votre candidature pour rejoindre l'équipe et contribuer aux
projets structurants et innovants du CEA !
Conformément aux engagements pris par le CEA en faveur de l’intégration des personnes en situation d’handicap, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation.
Localisation du poste
Site
Cadarache
Localisation du poste
France, Provence-Côte d'Azur, Bouches du Rhône (13)
Ville
Saint-Paul Lez Durance
Critères candidat
Langues
Anglais (Courant)
Formation recommandée
Diplôme d'ingénieur ou Master 2 en mathématiques appliquées (statistiques/Data Science)
Possibilité de poursuite en thèse
Non
Demandeur
Disponibilité du poste
01/02/2025