Postée il y a 13 heures
TITRE
Intégration multi-omique par intelligence artificielle : concevoir et évaluer un système agentique linguistique utilisant des graphes de connaissances pour l’exploration moléculaire
DESCRIPTION
Dans le cadre du consortium franco-suisse MetaboLinkAI (ANR-24-CE93-0012-01, https://www.metabolinkai.net), en partenariat avec l’Institut Interdisciplinaire d’Intelligence Artificielle (3IA) de la Côte d’Azur et grâce au financement de la Mission pour les initiatives transverses et interdisciplinaires (MITI CNRS), cette thèse vise à développer de nouvelles approches pour l’analyse multi-omique via l’intelligence artificielle. Le chercheur doctorant (H/F) aura pour mission de concevoir un système agentique linguistique innovant, interagissant sur des graphes de connaissances, capable d’intégrer et de structurer de manière dynamique des données complexes issues d’analyses omiques. En adoptant une démarche de science ouverte et collaborative, ce projet ambitionne de concevoir et évaluer un cadre méthodologique et logiciel pour l’exploration moléculaire, destiné à déchiffrer les interactions subtiles entre métabolites et expression génique. L’objectif ultime est d’enrichir notre compréhension des mécanismes du métabolisme et de ses fonctions, notamment dans le contexte de l’adaptation environnementale, en utilisant l’anémone de mer comme modèle biologique d’holobionte.
OBJECTIFS DE LA THÈSE
Le chercheur doctorant (H/F) aura pour missions de :
1. Conception d’un Cadre de Graph de Connaissance pour l’Intégration Multi-Omique
Le chercheur doctorant (H/F) concevra et validera des méthodes robustes pour transformer et enrichir des données expérimentales issues d’analyses omiques en graphes de connaissances interrogeables. Ce travail reposera sur des standards sémantiques (RDF, OWL, SPARQL, SHACL) et intégrera des techniques d’annotation automatique et de validation des métadonnées, garantissant ainsi l’exactitude et la complétude des informations. L’objectif sera de structurer ces données de manière évolutive pour faciliter leur interrogation via des agents linguistiques. Par ailleurs, le chercheur doctorant (H/F) intégrera des approches permettant d’interconnecter ces graphes avec des données issues de la littérature, afin d’enrichir et de contextualiser l’ensemble des connaissances multi-omiques.
2. Conception et Évaluation d’un Système d’Agents Linguistiques
S’appuyant sur les avancées du consortium MetaboLinkAI, le chercheur doctorant (H/F) développera une architecture d’agents linguistiques destinés à interroger des informations présentes dans le graph de connaissances. Ces agents interagiront de manière fluide avec la base de connaissances pour assurer l’accès aux données intégrées et leur mise à jour continue, en s’appuyant sur des modèles de langage avancés et des outils computationnels. Cette approche centralisera le traitement de bout en bout, transformant la donnée expérimentale brute en un graph enrichi, exploitable via le langage naturel. L’évaluation se fera à l’aide de questions de référence, définies en collaboration avec des experts, permettant d’analyser les performances des différentes architectures, flux, modèles et stratégies de prompt.
3. Optimisation et Auto-Adaptation du Système
Le chercheur doctorant (H/F) intégrera des mécanismes d’auto-optimisation novateurs pour améliorer continuellement les performances du système. En explorant des approches d’optimisation basées sur l’intelligence artificielle—telles que l’apprentissage par renforcement et le méta-apprentissage—il/elle développera des boucles de rétroaction avancées permettant d’ajuster dynamiquement, en temps réel, les modèles d’agents et les stratégies d’interrogation. Cette démarche proactive tiendra compte non seulement des retours des utilisateurs et des experts, mais anticipera également les évolutions des connaissances et les spécificités des jeux de données, garantissant ainsi une adaptabilité et une performance optimales du système.
4. Accès et Validation de Connaissances Multi-Omiques sur un Holobionte Marin
Le chercheur doctorant (H/F) démontrera l’efficacité de la méthode en l’appliquant à l’anémone de mer, modèle d’holobionte marin. En se concentrant sur l’accès et la validation des connaissances multi-omiques—notamment en explorant les mécanismes moléculaires d’adaptation environnementale—cette application visera à confirmer la capacité du système à transformer et enrichir des données multi-omiques en un graph de connaissances exploitable. Ce cas d’utilisation permettra de mettre en lumière comment l’intégration et l’interrogation des données contribuent à une meilleure compréhension de la résilience des organismes marins, ouvrant ainsi de nouvelles perspectives pour l’étude des systèmes biologiques complexes.
COMPÉTENCES SOUHAITÉES
Compétences techniques :
• Maîtrise de la programmation en Python, avec la capacité de développer des applications complexes et robustes.
• Expérience dans l’utilisation des outils et frameworks d’intelligence artificielle, notamment pour le développement de systèmes agentiques reposant sur de grands modèles de langage (par exemple, LangChain, Hugging Face ou équivalents).
• Expertise pointue en gestion et interrogation de graphes de connaissances, en s’appuyant sur des standards comme RDF, OWL, SPARQL et SHACL.
• Expérience en visualisation de données scientifiques pour créer des représentations interactives (graphes, diagrammes, cartes de réseaux) facilitant l’interprétation des relations complexes.
• Expérience des outils et méthodologies de gestion de code collaboratif et de projets open source, garantissant un suivi rigoureux et une transparence totale tout au long du projet.
Compétences relationnelles :
• Esprit d’initiative, grande autonomie, rigueur et adaptabilité face aux évolutions technologiques et scientifiques.
• Forte aptitude à travailler en équipe dans un environnement multidisciplinaire et multiculturel, en collaborant efficacement avec des chercheurs et des développeurs aux profils variés.
• Engagement pour une transparence totale et la collaboration en open source, assurant une gestion rigoureuse et partagée du code source et des méthodologies.
• Maîtrise de l’anglais scientifique, tant à l’oral qu’à l’écrit, pour garantir une communication fluide et efficace dans un contexte international.
Contexte de travail
La thèse se déroule sous la co-direction du Dr Louis-Félix Nothias, au cœur du laboratoire HolobiomicsLab de l’Institut de Chimie de Nice (ICN). L’HolobiomicsLab, qui explore l’intersection entre la métabolomique expérimentale et computationnelle, l’intégration multi-omique et l’intelligence artificielle, co-coordonne le projet MetaboLinkAI et est affilié à l’Institut Interdisciplinaire d’Intelligence Artificielle (3IA) de la Côte d’Azur. La thèse sera également co-dirigée par le Dr Fabien Gandon (Équipe WIMMICS, 3IS, INRIA Sophia Antipolis) et réalisée en collaboration avec l’équipe du Dr Eric Rottinger (Équipe Stress-Response, Regeneration & Longevity IRCAN). En alliant des expertises en métabolomique, multi-omique, graphes de connaissances et intelligence artificielle, ce projet favorise une synergie interdisciplinaire essentielle pour relever les défis de l’analyse intégrative des données multi-omiques. Des déplacements ponctuels en France et en Suisse sont à prévoir pour les réunions de projet et les conférences scientifiques.
Contraintes et risques
La réussite du projet dépendra d’une gestion rigoureuse du code source et d’une contribution collaborative, garantissant ainsi la transparence et la pérennité des développements réalisés en logiciel libre. Le chercheur doctorant (H/F) devra s’adapter à un environnement de recherche international et interdisciplinaire, où la coordination entre les différents partenaires et les échanges avec des équipes issues de cultures scientifiques diverses sont essentiels. Par ailleurs, il sera impératif de respecter les délais et de se conformer aux standards scientifiques et techniques imposés par le consortium MetaboLinkAI et la MITI CNRS, afin d’assurer la qualité et la pertinence des livrables tout au long de la thèse.