Stage de recherche : Conception d'un agent de raisonnement léger spécifique à un domaine

L’Isep propose un nouveau stage de recherche : Conception d’un agent de raisonnement léger spécifique à un domaine

Informations générales

Contrat : stage – 6 mois maximum
Localisation : Issy-les-Moulineaux
Date limite de candidature : 31 décembre 2025 à 23h59 (heure GMT+1)

Contexte et description

Les Large Language Models (LLMs) sont très performants pour la génération de texte et le raisonnement, mais une utilisation en une seule étape limite leur capacité à gérer un raisonnement multi-étapes sur de larges corpus techniques.

Les agents d’IA étendent les capacités des LLMs en leur permettant de planifier, de rechercher des informations et d’effectuer un raisonnement séquentiel. Combinés à la génération augmentée par récupération (Retrieval-Augmented Generation, RAG) [1], ces agents peuvent accéder à des documents externes (par exemple, des normes techniques ou des manuels) afin de produire des résultats éclairés et spécifiques à un domaine, sans que le modèle ait besoin de mémoriser l’ensemble des connaissances.

Ce stage porte sur la conception d’un agent d’IA léger exploitant :

un modèle LoRA [2] pré-entraîné pour le raisonnement spécifique au domaine des télécommunications ;
un cadre RAG [1] pour la récupération dynamique des documents pertinents ; tout en restant efficace sur des ressources de calcul limitées.

Missions

Les objectifs du stage incluent notamment :

Intégrer le modèle LoRA pré-ajusté en tant que cœur de raisonnement.
Mettre en œuvre un module de recherche (Qdrant e[3] ou FAISS [4]) pour accéder aux documents spécifiques au domaine des télécommunications.
Utiliser un script de contrôle pour gérer le raisonnement, la planification, la récupération et la réflexion l[5].
Procéder à l’évaluation des tâches de raisonnement multi-étapes.
Explorer des approches de raisonnement itératif (type ReAct [6], Reflexion [7] ou boucles inspirées de LangChain [5]).
Comparer les résultats des agents RAG multi-étapes à ceux des modèles à une seule étape.
S’assurer que l’agent fonctionne efficacement sur un seul GPU ou CPU.
Évaluer les compromis entre la taille de la récupération, le nombre d’étapes de raisonnement et la vitesse d’inférence.

Profil

Profil recherché :

Étudiant(e) en Master dans les domaines de la Data Science, de l’Intelligence Artificielle ou disciplines connexes.
Bonnes compétences en programmation Python.
Connaissances de PyTorch, des LLM, du RAG et des métriques d’évaluation en NLP.
Intérêt pour le raisonnement multi-étapes, la génération augmentée par récupération et les architectures d’agents IA.
Excellentes capacités d’analyse et de résolution de problèmes.
Bonnes aptitudes en communication et expérience du travail en équipe.
Bon niveau d’anglais oral et écrit (le français est un atout, mais non obligatoire).

Contact

Ce stage a une durée minimale de cinq (5) mois, débutant en février/mars 2026.

Les candidatures seront examinées au fur et à mesure de leur réception ; les candidats sont donc encouragés à postuler le plus tôt possible.

Les candidats intéressés sont invités à envoyer un CV détaillé, une lettre de motivation d’une page, deux références académiques ainsi que le relevé de notes de M1 à l’adresse suivante : idowu.ajayi@isep.fr et wafa.njima@isep.fr.

Pour les candidatures, l’objet de votre courriel devra être : « Candidature pour le stage – Design of a Lightweight Domain-Specific Reasoning Agent ».

Date limite de candidature : 31 décembre 2025 à 23h59 (heure GMT+1).

Bibliographie

[1] P. Lewis et al., “Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks,” Apr. 12, 2021, arXiv: arXiv:2005.11401. doi: 10.48550/arXiv.2005.11401.

[2] E. J. Hu et al., “LoRA: Low-Rank Adaptation of Large Language Models,” Oct. 16, 2021, arXiv: arXiv:2106.09685. doi: 10.48550/arXiv.2106.09685.

[3] S. Ockerman et al., “Exploring Distributed Vector Databases Performance on HPC Platforms: A Study with Qdrant,” Sept. 15, 2025, arXiv: arXiv:2509.12384. doi: 10.48550/arXiv.2509.12384.

[4] J. Johnson, M. Douze, and H. Jégou, “Billion-Scale Similarity Search with GPUs,” IEEE Trans. Big Data, vol. 7, no. 3, pp. 535–547, July 2021, doi: 10.1109/TBDATA.2019.2921572.

[5] H. Chase, LangChain. (Oct. 2022). Python. Accessed: Oct. 16, 2025. [Online]. Available: https://github.com/langchain-ai/langchain

[6] S. Yao et al., “ReAct: Synergizing Reasoning and Acting in Language Models,” Mar. 10, 2023, arXiv: arXiv:2210.03629. doi: 10.48550/arXiv.2210.03629.

[7] N. Shinn, F. Cassano, E. Berman, A. Gopinath, K. Narasimhan, and S. Yao, “Reflexion: Language Agents with Verbal Reinforcement Learning,” Oct. 10, 2023, arXiv: arXiv:2303.11366. doi: 10.48550/arXiv.2303.11366.

Cookie	Durée	Description
cookielawinfo-checkbox-analytics	11 mois	Ce cookie est défini par le plugin GDPR Cookie Consent. Le cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie « Analytics ».
cookielawinfo-checkbox-autres	1 an	Défini par le plugin GDPR Cookie Consent pour stocker le consentement de l'utilisateur pour les cookies de la catégorie « Autres ».
cookielawinfo-checkbox-fonctionnel	1 an	Défini par le plugin GDPR Cookie Consent, ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie « Fonctionnels ».
cookielawinfo-checkbox-necessaire	1 an	Défini par le plugin GDPR Cookie Consent, ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie « Nécessaire ».
cookielawinfo-checkbox-performance	11 mois	Ce cookie est défini par le plugin GDPR Cookie Consent. Ce cookie est utilisé pour stocker le consentement de l'utilisateur pour les cookies de la catégorie « Performance ».
CookieLawInfoConsent	1 an	CookieYes définit ce cookie pour enregistrer l'état du bouton par défaut de la catégorie correspondante et le statut du CCPA. Il ne fonctionne qu'en coordination avec le cookie principal.
viewed_cookie_policy	11 mois	Le cookie est défini par le plugin GDPR Cookie Consent et est utilisé pour enregistrer si l'utilisateur a consenti ou non à l'utilisation de cookies. Il ne stocke aucune donnée personnelle.
XSRF-TOKEN	2 heures	Ce cookie renforce la sécurité de la navigation des visiteurs en empêchant la falsification des requêtes intersites.

Cookie	Durée	Description
pll_language	1 an	Le cookie pll _language est utilisé par Polylang pour se souvenir de la langue sélectionnée par l'utilisateur lorsqu'il revient sur le site web, et également pour obtenir des informations sur la langue lorsqu'elles ne sont pas disponibles d'une autre manière.
yt-remote-cast-installed	session	Le cookie yt-remote-cast-installed est utilisé pour stocker les préférences du lecteur vidéo de l'utilisateur lors de l'utilisation de vidéos YouTube intégrées.
yt-remote-connected-devices	jamais	YouTube utilise ce cookie pour stocker les préférences vidéo de l'utilisateur lors de l'utilisation de vidéos YouTube intégrées.
yt-remote-device-id	jamais	YouTube utilise ce cookie pour stocker les préférences vidéo de l'utilisateur lors de l'utilisation de vidéos YouTube intégrées.
yt-remote-fast-check-period	session	Le cookie yt-remote-fast-check-period est utilisé par YouTube pour stocker les préférences du lecteur vidéo de l'utilisateur pour les vidéos YouTube intégrées.
yt-remote-session-app	session	Le cookie yt-remote-session-app est utilisé par YouTube pour stocker les préférences de l'utilisateur et des informations sur l'interface du lecteur vidéo YouTube intégré.
yt-remote-session-name	session	Le cookie yt-remote-cast-installed est utilisé pour stocker les préférences du lecteur vidéo de l'utilisateur lors de l'utilisation de vidéos YouTube intégrées.
ytidb::LAST_RESULT_ENTRY_KEY	jamais	Le cookie ytidb::LAST_RESULT_ENTRY_KEY est utilisé par YouTube pour stocker le dernier résultat de recherche sur lequel l'utilisateur a cliqué. Cette information est utilisée pour améliorer l'expérience de l'utilisateur en fournissant des résultats de recherche plus pertinents à l'avenir.

Cookie	Durée	Description
_ga	1 an	Le cookie _ga, installé par Google Analytics, calcule les données relatives aux visiteurs, aux sessions et aux campagnes et suit également l'utilisation du site pour le rapport d'analyse du site. Le cookie stocke les informations de manière anonyme et attribue un numéro généré de manière aléatoire pour reconnaître les visiteurs uniques.
_ga_*	1an 1 mois 4 jours	Google Analytics utilise ce cookie pour stocker et compter les pages vues.

Cookie	Durée	Description
__Secure-ROLLOUT_TOKEN	6 mois	La description n'est pas disponible actuellement.
_pk_id.4.3c86	1 an 1 mois	La description n'est pas disponible actuellement.
_pk_ref.4.3c86	6 mois	La description n'est pas disponible actuellement.
_pk_ses.4.3c86	1 heure	La description n'est pas disponible actuellement.
oscar_session	2 heures	La description n'est pas disponible actuellement.
WEBSRVID	session	Pas de description
weezevent	session	La description n'est pas disponible actuellement.

Cookie	Durée	Description
NID	6 mois	Google installe le cookie à des fins publicitaires, pour limiter le nombre de fois où l'utilisateur voit une annonce, pour désactiver les annonces non souhaitées et pour mesurer l'efficacité des annonces.
VISITOR_INFO1_LIVE	6 mois	YouTube utilise ce cookie pour mesurer la bande passante et déterminer si l'utilisateur bénéficie de l'ancienne ou de la nouvelle interface de lecture.
VISITOR_PRIVACY_METADATA	6 mois	YouTube utilise ce cookie pour stocker l'état du consentement de l'utilisateur en matière de cookies pour le domaine actuel.
YSC	session	Youtube place ce cookie pour suivre les vues des vidéos intégrées sur les pages de Youtube.
yt.innertube::nextId	jamais	YouTube utilise ce cookie pour enregistrer un identifiant unique afin de stocker des données sur les vidéos de YouTube que l'utilisateur a vues.
yt.innertube::requests	jamais	YouTube utilise ce cookie pour enregistrer un identifiant unique afin de stocker des données sur les vidéos de YouTube que l'utilisateur a vues.

Stage de recherche : Conception d’un agent de raisonnement léger spécifique à un domaine