CDD 18 Mois
WASORIA

Gestionnaire de données pour l’apprentissage automatique (H/F)

Le Creusot (71200)
Publié le 21/05/2025

Description du poste

En tant que Gestionnaire de données pour l’apprentissage automatique, vous jouez un rôle clé dans la qualité et la fiabilité des données utilisées pour entraîner et évaluer nos modèles d’intelligence artificielle. Vous êtes responsable de la collecte, du nettoyage, de l’annotation, du stockage et de la mise à disposition de données structurées à grande échelle. Vos principales responsabilités comprendront, sans que la liste en soit exhaustive :

– Participer ponctuellement à des tâches d’annotation de données.
– Contrôler la qualité des annotations produites par les prestataires externes et fournir des retours afin d’assurer leur montée en compétences.
– Gérer la qualité des données: détection d’anomalies, évaluation de la représentativité, gestion des biais.
– Assurer le prétraitement, le nettoyage, le filtrage et la normalisation des jeux de données.
– Concevoir et développer des outils permettant d’optimiser la gestion et le traitement des données d’apprentissage.
– Concevoir, développer et maintenir des pipelines de données robustes et scalables.
– Collaborer avec les équipes de chercheurs et ingénieurs IA pour comprendre les besoins en données.
– Participer à la conception et la maintenance de bases de données.
– Assurer la documentation des jeux de données et leur versioning.
– Appliquer les bonnes pratiques de gouvernance des données.

Qualifications requises

– Bac +3 à Bac +5 en informatique, science des données, IA ou domaine connexe.
– Expérience de 1 an minimum dans un rôle similaire (ou stage significatif pour un junior motivé).
– Solides connaissances en traitement d’images, vision par ordinateur et deep learning.
– Expérience avec les frameworks d’IA et de vision par ordinateur tels que TensorFlow, PyTorch, OpenCV.
– Compétences en programmation (Python, C++, Matlab).
– Connaissance des techniques de prétraitement de données et des outils de manipulation de données (Pandas, NumPy).
– Expérience avec les bases de données (SQL, NoSQL) et les systèmes de versionnage (Git).
– Sens du détail, rigueur et autonomie.
– Intérêt marqué pour l’apprentissage automatique et la qualité des données.
– Capacité à travailler en équipe et à communiquer efficacement avec des membres d’équipes multidisciplinaires

Postuler

D'autres offres d'emploi similaires