Staff Data Scientist (H/F/X)

À propos

Qwant est un moteur de recherche développé et hébergé en Europe, qui respecte ses utilisateurs.

Depuis sa création, Qwant tient un engagement fort : ne jamais revendre les données personnelles de ses utilisateurs, tout en offrant une expérience de recherche performante et adaptée aux usages du quotidien.

Qwant repense également les règles de la recherche web grâce à sa fonctionnalité phare basée sur l’IA, la Réponse Flash. Directement intégrée au moteur de recherche, cette intelligence artificielle permet de fournir des réponses courtes, précises et instantanées à de nombreuses questions, sur une grande variété de sujets : actualités, culture, sport, informations administratives… le tout gratuitement et dans le respect de la vie privée.

En parallèle, Qwant développe, via son partenariat stratégique avec le moteur de recherche allemand Ecosia, son propre index de recherche baptisé Staan. Cette technologie de search 100 % européenne permet aux moteurs de recherche, mais aussi aux développeurs et aux entreprises, de trouver et d’exploiter les contenus les plus récents​ et pertinents du web.

Descriptif du poste

En tant que Staff Data Scientist chez Qwant, vous êtes le·la lead technique transverse de la Data Science : vous portez en central les standards ML et la stratégie scientifique pour améliorer notre moteur de recherche. Pour cela, vous défrichez les sujets les plus exigeants (Information retrieval et rich context information retrieval), et suivez sa mise en œuvre dans les Squads. Votre expertise et votre sens du mentorat permettra l’émergence d’autres leaders techniques au sein des squads pour que nos standards et la qualité de nos produits soient toujours plus élevés.

Vous êtes hands-on. Vous codez encore, pour défricher de nouvelles approches et sur les sujets transverses : templates, ML platform, frameworks d'évaluation, log and learn, POCs sur les chantiers stratégiques. Vous travaillez en peer technique de l'Engineering Manager Data Science et du VP Data, avec des mandats distincts et complémentaires : eux portent le delivery, l'humain et le budget ; vous portez la trajectoire technique.

Notre stack cible (Data Platform, Iceberg, MLOps) est en cours de construction, et c'est précisément ce que vous venez aider à finir. Si vous cherchez une organisation où les standards sont déjà écrits, ce poste n'est pas pour vous. Si vous voulez être l'un·e des architectes de cette bascule, poser les fondations qui permettront à 6 Data Scientists et 2 MLOps de livrer plus vite et mieux, et avoir un impact massif sur un produit souverain à grande échelle... (Vous allez vous amuser).

Vos missions :

  • Vous définissez et portez les standards ML en promouvant et adaptant les Rules of ML (Zinkevich) à notre contexte Search & IA. En tant qu’architecte du Log & Learn, vous loggez les inputs des modèles à l’inférence afin de monitorer au-delà des seules sorties et de constituer des datasets issus de la production, tout en limitant les risques de train/serving skew. Vous co-construisez avec l’EM DS et la Data Platform les fondations qui fluidifient la mise en production : templates, plateforme ML, monorepo Python, frameworks d’évaluation (NDCG, A/B testing, side-by-side, golden sets, LLM-as-judge).

  • Vous défrichez les sujets complexes en mode hands-on en portant techniquement les chantiers transverses qui n’appartiennent à aucune squad (Web Search for AI, Learning without Bing, et leurs successeurs). Vous cadrez l’approche, livrez un POC ou une architecture de référence, puis accompagnez leur transmission aux squads.

  • Vous alignez les équipes autour de la qualité en vous assurant qu’une définition partagée existe entre Product, Research et Data Science de ce qu’est un bon résultat Search pour un visiteur, versus un bon retrieval pour un LLM. Vous ne définissez pas seul·e cette qualité ; vous garantissez qu’elle soit explicite, comprise et partagée par l’ensemble des équipes.

  • Vous accompagnez la montée en compétence des profils seniors vers des rôles de Lead technique en squad à travers le pair design, les RFC, les revues de code et de design, ainsi qu’un leadership technique incarné sur les sujets les plus exigeants. Le développement de carrière reste porté par l’EM ; vous contribuez, de votre côté, à faire grandir techniquement les équipes. Vous participez également activement aux recrutements via la conception et la conduite des entretiens techniques DS.

  • Vous arbitrez les choix technologiques et défendez la souveraineté technique en animant le tech radar DS et en faisant émerger explicitement les arbitrages build vs buy, avec une forte préférence pour les solutions open-source et européennes. Vous construisez les ponts cross-équipes avec Engineering, Product et Research, et remontez au VP Data les frictions organisationnelles que vous identifiez.

Profil recherché

Vous ne vous reconnaissez pas à 100 % dans les critères ci-dessous ? Aucun problème, envoyez quand même votre CV ! Tous les critères ne sont pas éliminatoires : votre passion, votre curiosité et votre motivation nous aideront à vous faire grandir 😉

  • Vous justifiez de 8+ années d’expérience en Data Science / Machine Learning, avec un track record solide sur des sujets transverses et multi-équipes (Staff, Principal ou Lead senior sur un scope transverse).

  • Vous adoptez un mindset pragmatique : vous préférez un if/else qui résout 80 % du problème à un modèle qui en résout 85 % pour 10x plus de coût de maintenance. Vous savez également reconnaître lorsque la complexité est nécessaire, et l’assumer pleinement.

  • Vous comprenez les dynamiques d’organisation et l’importance de la collaboration pour faire avancer les sujets. Vous influencez par la qualité de votre raisonnement, de votre communication et de votre empathie, plus que par le titre. Vous êtes à l’aise pour challenger les équipes Product, Engineering et le leadership.

  • Vous disposez de solides expertises en Search (Information Retrieval, ranking, NLP, embeddings, LLM) ainsi que sur des problématiques à forte volumétrie et contraintes de latence (recommandation, ads). Vous maîtrisez les méthodologies d’évaluation ML offline et online, et savez les concevoir autant que les exécuter.

  • Vous maîtrisez parfaitement Python, SQL et l’écosystème ML (scikit-learn, XGBoost, PyTorch, Transformers). Vous restez hands-on : vous aimez coder et continuez à le faire avec plaisir.

  • Vous avez déjà mis en place des standards ML / MLOps au sein d’une équipe : logging, monitoring, gestion du train/serving skew, model registry, frameworks d’évaluation, retraining et promotion de modèles.

Bonus appréciés :

  • Vous avez une expérience avec notre stack cœur : Kubernetes, Kafka, Doris, Iceberg, Vespa AI.

  • Vous avez accompagné l’émergence de Leads techniques au sein d’une équipe via le mentorat.

  • Vous êtes familier·ère des Rules of ML de Zinkevich, ou d’un framework équivalent que vous avez déjà porté.

  • Vous avez une forte sensibilité aux enjeux de souveraineté numérique européenne.

Stack technique :

  • Index et ranking déployés sur Vespa AI

  • Datasets multimodaux; Tb (du gradient boosting trees aux modèles de langage)

  • Training sur cluster Kube, distribué sur des machines multi-GPUs

  • Tracking & registry : MLFlow

  • Logging : in-house data platform (Kafka, Iceberg, Doris, DBT, Metabase)

Process de recrutement

Nous vous proposerons un échange de 30 minutes avec une personne de l’équipe Recrutement afin de faire connaissance et de vous présenter le poste.

S’il nous semble pertinent, pour vous comme pour nous, d’avancer ensemble, vous rencontrerez ensuite :

  • Pierre-François, notre VP Data

  • Deux de nos Data Scientist, lors d’un entretien centré sur votre culture technique

  • Machavia, notre CTO, ainsi que Marion, notre Product Manager, lors d’un entretien dans nos locaux

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Paris
  • Télétravail partiel possible