Informations générales
Référence
FRA-REC-2025-23544
Date de début de diffusion
18/09/2025
Périmètre de publication
Standard
Description du poste
Famille professionnelle / Métier
MECA CHAUDRONNERIE ROBINETTERIE MATERIAUX - Ingénierie de conception
Intitulé du poste
Stage - Ingénieur R&D Machine Learning for Optimal Control F/H
Type de contrat
Stage
Description de la mission
Contexte
Au sein du département DTIPC-F (études neutroniques), vous rejoindrez une équipe de R&D spécialisée en automatique et en intelligence artificielle appliquées au pilotage de systèmes complexes.
Le stage s’inscrit dans le cadre du développement d’une méthode d’apprentissage en temps réel (online learning) visant à améliorer la précision des méthodes de commande prédictive d’un réacteur nucléaire.
Ce travail, à l’interface entre machine learning et ingénierie nucléaire, a un impact direct sur la sûreté et la performance des installations.
Lors de la mise en œuvre d’un algorithme de commande prédictive en temps réel, un écart persistant apparaît entre :
- le modèle de simulation théorique,
- et le comportement physique réel du réacteur.
Cet écart, variable dans le temps et spécifique à chaque installation, peut être estimé grâce aux données d’exploitation.
L’objectif est donc de concevoir un modèle statistique adaptatif capable de corriger cet écart en ligne.
Objectifs du stage
- Réaliser un état de l’art des méthodes d’apprentissage statistique en ligne.
- Concevoir un modèle adaptatif capable de corriger en temps réel l’erreur de prédiction/simulation.
- Évaluer différentes familles de modèles de séries temporelles (réseaux de neurones, méthodes ensemblistes, régressions avancées…), selon : performance quantitative, complexité et explicabilité.
- Implémenter et entraîner les modèles, constituer un jeu de données représentatif, comparer les approches retenues.
- Analyser la Sample Complexity : obtenir des garanties théoriques sur le nombre minimal de données nécessaires pour apprendre la fonction cible.
- (Optionnel) Intégrer des stratégies d’active learning pour recaler le modèle en fonction des variations physiques réelles.
- (Optionnel) Définir une stratégie de contrôle optimal basée sur le modèle corrigé (physique + ML).
- (Si l’avancée le permet) Explorer des approches de contrôle autonome en temps réel (Active Reinforcement Learning).
Mots-clés
Statistical Learning
Active Learning
Time Series Forecasting
Physics-Informed Neural Networks (PINN)
Optimal Control
Profil souhaité
Vous êtes en dernière année d’école d’ingénieur ou équivalent universitaire, avec une spécialisation en mathématiques appliquées, automatique ou intelligence artificielle, et vous recherchez un stage de fin d’études.
Vous savez faire preuve d’initiative et d’autonomie dans vos travaux, tout en ayant le goût de la recherche appliquée.
Vous disposez d’une aptitude à travailler en équipe et d’une capacité de dialogue, en particulier pour expliquer clairement vos choix et résultats.
La maîtrise de l’anglais (oral et écrit) est requise.
Vous avez un intérêt (apprécié) pour l’automatique et le contrôle, des notions en Matlab/SIMULINK, ainsi qu’une curiosité pour le secteur nucléaire et énergétique.
La/le stagiaire sera directement intégré(e) à une équipe de R&D en automatique et sera encadré(e) par un ingénieur ainsi qu’un doctorant du Pôle DTIPC.
Date souhaitée de début de mission
02/03/2026
Société
Framatome
Localisation du poste
Localisation du poste
Europe, France, Ile-de-France, Hauts-de-Seine (92)
Ville
La Défense
Langue de l'offre
Français - English
Critères candidat
Niveau de formation
06 - BAC +4 / BAC +5
Spécialisation du diplôme
Ingénierie d'Etudes
Expérience minimum souhaitée
Débutant
Compétences transverses
Sens du résultat
Langues
Anglais (B1 - Utilisateur indépendant)