Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2024-32177
Description de l'unité
L'Institut LIST dédie ses activités aux systèmes numériques intelligents avec des programmes de R&D dans le manufacturing avancé, les systèmes embarqués, et l'intelligence ambiante. Nous accompagnons nos partenaires dans les domaines des transports, de l'industrie, de l'énergie, de la santé, de la sécurité et de la défense, pour transférer les technologies issues de l'innovation et améliorer leur compétitivité. Au sein du LIST, les équipes du Laboratoire Ingénierie des Langages Exécutables et Optimisation (LIDEO) travaillent sur l'élaboration d'environnement logiciels pour la conception et le déploiement de jumeaux numériques dans de multiples domaines d'application (manufacturing, logistique, transport, etc.). Cela concerne notamment le développement de fonctionnalités de modélisation, simulation, et optimisation de ces systèmes.
Description du poste
Domaine
Mathématiques, information scientifique, logiciel
Contrat
Stage
Intitulé de l'offre
Stagiaire - Aide à la traduction de processus métiers en modèles avec un LLM H/F
Sujet de stage
Les référentiels de processus métiers d'une organisation (industrie, établissement médical, service public) restent le plus souvent décrits en langage naturel. La modélisation de ces processus métiers est un moyen de formaliser, d'analyser, d'optimiser, de standardiser et de systématiser les activités de l'organisation. Bien que des langages comme BPMN (et les outils et méthodes associés) aient été développés pour ces besoins, le travail de traduction dans ce langage formel demande une forte expertise, devenant en pratique un obstacle.
Pour aider cette traduction, un LLM (Large Language Model) dédié à la traduction de langage naturel en langage formel de description de processus, comme BPMN peut être développé.
Durée du contrat (en mois)
[3 à 6 mois]
Description de l'offre
Le (la) candidat(e) participera à la mise au point de ce LLM notamment en alimentant le processus d'instruction du modèle avec des exemples tirés de documents issus d’un référentiel établi dans le domaine hospitalier et traduits semi manuellement en BPMN. L'instruction d'un LLM se fait en présentant un certain nombre de tels exemples puis en demandant au LLM d'en générer d'autres qui peuvent être alors corrigés manuellement avant d'être réinjectés. Cela s'arrête quand on considère que le modèle est suffisamment bon ; c’est-à-dire quand les sorties sont correctes, exécutables et avec peu d'hallucinations.
Ce travail sera réalisé et encadré au Laboratoire d’Ingénierie des Langages Exécutables et Optimisations à Grenoble avec l’équipe qui apporte son expertise en modélisation et exécution de processus métiers. Une collaboration avec le Laboratoire d'Analyse Sémantique Texte et Image à Saclay apportera sa grande expérience en apprentissage automatique et en particulier dans l'entraînement, le fine-tuning ou le few shot learning des LLM. Les travaux prévus dans ce stage pourront s’appuyer sur plusieurs infrastructures d'exploitation de LLM déjà déployées par les équipes. De plus, le cluster IA du CEA LIST disposant de plusieurs centaines de GPU, déployé sur le site du TGCC, pourra être exploité pour ces travaux.
Le stage se déroulera au CEA Grenoble mais des déplacements ponctuels sur le centre de Saclay NanoINNOV seront possibles.
Moyens / Méthodes / Logiciels
LLM, Python, BPMN, C/C++, Java
Profil du candidat
Etudiant(e) licence 3, master 1-2 en informatique ou école d’ingénieurs.
Conformément aux engagements pris par le CEA en faveur de l’intégration de personnes en situation de handicap, cet emploi est ouvert à tous et toutes.
Localisation du poste
Site
Grenoble
Localisation du poste
France, Auvergne-Rhône-Alpes, Isère (38)
Ville
Grenoble
Critères candidat
Langues
Anglais (Intermédiaire)
Diplôme préparé
Bac+4/5 - Diplôme de recherche technologique (DRT/DRI)
Formation recommandée
Ingénieur, licence, master
Possibilité de poursuite en thèse
Oui