Stagiaire LLM - Entrepôt de données de santé

  • Paris
  • Stage
  • Date de début : 01 septembre 2025
  • Postuler

À propos

codoc développe des solutions pour démocratiser l’utilisation des données médicales au sein des établissements de santé afin de progresser la recherche et améliorer le soin.

Après plus de 10 ans de recherche et développement menés par Nicolas Garcelon au sein de la plateforme de Data Science de l’Institut Imagine, l’outil “Dr. Warehouse” voit le jour et remporte un franc succès auprès des équipes.

C’est la création de cet outil qui donne naissance en 2017 à codoc cofondé par Nicolas Garcelon, Arthur Delapalme et l'Institut Imagine.

La suite codoc regroupe aujourd'hui une solution d’entrepôt de données santé intelligent, une application de fouille et d’analyse des données de santé et une plateforme de transparence pour faciliter l’information patients.

Rejoindre codoc, c'est rejoindre une entreprise dynamique et engagée pour rendre la donnée médicale accessible et utile aux professionnels de santé pour accélérer la recherche et améliorer la prise en charge des patients.

Rejoindre codoc c'est contribuer à construire le système de santé de demain.

Pour en savoir plus, rendez-vous sur www.codoc.co

Descriptif du poste

Codoc recherche un·e stagiaire Data Scientist pour rejoindre son équipe R&D et explorer le potentiel des modèles de langage (LLMs) appliqués aux données cliniques, dans le contexte des entrepôts de données de santé (EDS).

Tu travailleras à l’intégration de ces modèles dans nos outils internes et auprès de nos partenaires hospitaliers, afin de faciliter la structuration, l’accès et l’exploitation des données de santé, au service du soin et de la recherche.

Tes missions :

  • Faciliter l’usage des outils via les LLMs

    Tu mettras en œuvre des LLMs pour assister les utilisateurs (cliniciens, data scientists, chefs de projet…) dans la formulation de requêtes complexes, la transformation de texte libre en formats structurés, ou l’explication des résultats.

  • Restructurer les données à l’aide des LLMs

    Tu testeras l’usage des LLMs pour résumer des dossiers patients, extraire automatiquement des éléments clés (diagnostics, antécédents, traitements…) ou pré-annoter les données en vue de leur intégration dans des formats standardisés.

  • Évaluer et comparer les approches

    Tu conduiras des benchmarks entre différentes approches (LLMs vs méthodes classiques) sur des cas d’usage concrets, en définissant des jeux de test et des métriques adaptés à la donnée clinique.

  • Proposer des améliorations concrètes

    Tu seras force de proposition pour intégrer ces modèles dans des parcours utilisateurs réels, que ce soit via des prototypes ou des modules intégrés aux outils existants de Codoc.

Profil recherché

Si tu te reconnais dans au moins cinq de ces points, n’hésite pas à nous contacter pour ce poste.

Si ton profil ne correspond pas mais que codoc t’intéresse, tu peux aussi nous contacter car nous agrandissons notre équipe produit.

  • Master 2 en école d’ingénieur ou en cursus Data Science / Intelligence Artificielle

  • Une appétence pour les enjeux des industries de santé et la recherche clinique

  • Expérience avec des modèles NLP, notamment LLMs ou embeddings cliniques

  • Maitrise des langages de programmation en particulier Python

  • Connaissance des ontologies médicales (UMLS, HPO)

  • Esprit analytique, rigueur et autonomie

  • Connaissance en recherche bibliographique et veille technologique

Process de recrutement

Processus de recrutement :

Nous essayons d’éviter les processus lourds qui s’étendent sur plusieurs mois, mais pour nous il est important qu’il y ait un vrai fit avec l’équipe, ce qui induit de prendre un peu de temps :

  • Validation de ta candidature et échange par visio (30 minutes)

  • Rencontre avec l’équipe et test technique (physique - 1h30)

  • Débrief détaillé

  • Proposition de stage

Conditions du stage :

  • Durée du stage: 6 mois

  • Lieu: Paris Liberté Living Lab, rue Alexandrie.

  • Date de début: Entre le 1er septembre et le 30 septembre en fonction de tes disponibilités

  • Télétravail: autorisé à partir de deux mois de stage

  • Des tickets-restaurants

  • Mac

  • Transport (50%

Informations complémentaires

  • Type de contrat : Stage (5 à 6 mois)
  • Date de début : 01 septembre 2025
  • Lieu : Paris
  • Niveau d'études : Bac +5 / Master
  • Expérience : < 6 mois
  • Télétravail ponctuel autorisé