Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.
Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2024-33981
Description du poste
Domaine
Mathématiques, information scientifique, logiciel
Contrat
Stage
Intitulé de l'offre
Secure Data Sharing Policy Recommendation with LLMs H/F
Sujet de stage
Notre laboratoire développe un outil permettant à un consortium d'acteurs souhaitant échanger des données de spécifier ces échanges grâce à une approche de model engineering où les acteurs établissent et spécifient ensemble un processus métier. L'objectif de ce stage est d'ajouter à l'outil de modélisation du laboratoire un outil d'aide à la modélisation basé IA, par exemple par une approche basée LLM. Cette extension permettra de générer un processus métier à partir de documentation fournie par le consortium. Elle permettra également d'extraire la spécification des échanges données (e.g., degré de confidentialité, contraintes d'accès etc). Elle permettra enfin d'adapter le processus et la spécification générée suite à une analyse de vulnérabilités. Le stage impliquera le développement d'un prototype du système et l'évaluation de ses performances sur un ensemble de scénarios d'échange de données issus de use cases industriels.
Durée du contrat (en mois)
6
Description de l'offre
Le partage de données sensibles peut être sujet à des attaques cyber de la part d’acteurs malveillants lors de collaborations multi-acteurs. Un exemple concerne l’interception de données de santé partagées entre plusieurs hôpitaux pour entraîner un modèle IA afin de revendre ces données. Un autre exemple concerne l’interception de données concurrentielles au sein d’une supply chain par un concurrent pour repositionner son prix de vente à son avantage. Une stratégie de partage des données est donc essentielle pour préserver la confidentialité des données, garantir la confiance entre les acteurs, et protéger les informations stratégiques tout en assurant le bon fonctionnement du réseau. Cependant, la sélection et la mise en œuvre des stratégies de partage sécurisé des données peuvent être complexes et prendre beaucoup de temps. Hors cette sélection doit être adaptée en fonction des exigences des utilisateurs et de l’environnement d’exécution. Il existe donc un besoin d’outils d’aide à la décision pour orienter les architectes métiers à sélectionner et à appliquer des techniques de partage de données appropriés au cas d'utilisation donné. Notre laboratoire développe un outil permettant à un consortium d’acteurs souhaitant échanger des données de spécifier ces échanges par le biais d'un modèle de processus métier qui sera exécuté par un smart contract. L'exécution de ce smart contract permettra de notariser chaque échange de données dans la blockchain à des fins d’audit. Une étape de simulation permet d’identifier les vulnérabilités du processus afin d’améliorer sa robustesse. L’objectif de ce stage est d’ajouter à l’outil de modélisation du laboratoire un outil d’aide à la modélisation basé IA, par exemple par une approche basée LLM. Cette extension permettra de spécifier le processus métier et les contraintes sur les échanges de données, elle permettra aussi d’adapter le processus et la spécification suite à une analyse de vulnérabilités.
Le/La candidat(e) retenu(e) rejoindra le Laboratoire Systèmes d'Information de Confiance, Intelligents et Auto-Organisants (LICIA) au CEA LIST.
Le/La stagiaire aura les responsabilités suivantes :
- État de l'art et analyse des besoins : Réaliser une revue exhaustive de la littérature et des solutions existantes autour de systèmes d’aide à la modélisation basés LLM dans un cadre cyber. Identifier les défis et besoins liés au cas d’usage.
- Conception de l'architecture de solution : Élaborer une architecture détaillée basée LLM pour une solution d’aide à la modélisation de systèmes de gouvernance cyber, en tenant compte des contraintes techniques et opérationnelles identifiées.
- Développement du prototype : Sur la base de l'architecture conçue, développer un prototype fonctionnel de la solution.
- Tests et validation : Effectuer une série de tests pour valider la fiabilité, la sécurité, et la performance de la solution.
- Documentation et transfert de connaissances
Moyens / Méthodes / Logiciels
Développement web (Javascript / REST... ) et smart contracts (langage Solidity)
Profil du candidat
Le/La candidat(e) doit avoir les compétences suivantes :
- Connaissance en cryptographie, sécurité informatique.
- Connaissance de l’ingénierie du logiciel (expérience préalable des modèles de développement, du cycle de vie du logiciel, ou de l’intégration continue est un atout).
- Connaissance des principes avancés de la conception du logiciel (expérience préalable des langages fortement typés, du polymorphisme, de la programmation générique, des templates, ou des design patterns est un atout).
Localisation du poste
Site
Saclay
Localisation du poste
France
Ville
Saclay
Critères candidat
Diplôme préparé
Bac+5 - Diplôme École d'ingénieurs
Formation recommandée
Etudiant(e) master 2 en informatique/ingénierie.
Possibilité de poursuite en thèse
Oui
Demandeur
Disponibilité du poste
01/02/2025