Conseiller(ère) principal(e) - Ingénierie IA
Deloitte View all jobs
- Canada
- $72,000-138,000 per year
- Permanent
- Full-time
- Collaborer avec les gestionnaires et les ingénieurs de produits et avec les parties prenantes pour concevoir des solutions axées sur l'IA qui répondent aux exigences techniques et d'affaires.
- Effectuer la recherche, le prototypage et le développement d'applications d'IA générative en combinant des GML non déterministes et des techniques déterministes de génie logiciel.
- Établir des cadres d'évaluation et des points de référence pour mesurer la qualité des modèles, leur fiabilité et l'incidence sur l'entreprise.
- Générer régulièrement des rapports sur l'exactitude, la dérive et le rendement des modèles.
- Déboguer, optimiser et améliorer les applications d'IA générative à l'aide de pratiques exemplaires d'ingénierie de requêtes, d'apprentissage par renforcement, d'affinage et d'ingénierie logicielle.
- Entraîner et affiner des grands modèles de langage à l'aide des transformeurs de Hugging Face.
- Appliquer des techniques d'affinage de l'apprentissage par renforcement à l'aide de la bibliothèque TRL (Transformers Reinforcement Learning) de Hugging Face.
- Gérer les flux d'entraînement à l'aide d'outils de suivi des expériences et d'accélérateurs de l'apprentissage distribué (DeepSpeed, Accelerate, FSDP).
- Exécuter et optimiser l'entraînement et l'inférence de multiples unités de traitement graphique, en tirant parti de vLLM pour un service à haut débit de traitement et à faible latence.
- Contribuer à la conception de pipelines d'opérations d'apprentissage machine (OAM)/DevOps évolutifs pour le déploiement de modèles, la surveillance et l'entraînement continu.
- Assurer la conformité aux directives sur la confidentialité et la sécurité des données et sur l'IA responsable lors de la gestion de l'entraînement ou des ensembles de données de test.
- Se tenir au courant des recherches émergentes dans le domaine des GML, de l'apprentissage par renforcement à partir de la rétroaction humaine ou de la rétroaction de l'IA, de l'IA multimodale et des modèles génératifs; appliquer les résultats pour améliorer nos systèmes.
- Rédiger de la documentation technique et contribuer à des publications, des brevets ou des projets de code source libre, le cas échéant.
- Occasion de travailler sur des projets d'IA et de gouvernance des données de pointe avec des organisations de premier plan.
- Environnement inclusif propice au travail de collaboration.
- Apprentissage continu et perfectionnement professionnel.
- Régime de rémunération et d'avantages sociaux concurrentiel.
Les candidats ayant de l'expérience relativement aux outils et cadres suivants seront fortement privilégiés :
- Transformeurs (Hugging Face) pour l'entraînement des modèles, l'affinage et l'inférence.
- Bibliothèque TRL (Transformers Reinforcement Learning) pour l'affinage basé sur l'apprentissage par renforcement (optimisation des politiques proximales - PPO, optimisation directe des préférences - DPO, optimisation de la politique relative de groupe - GRPO, apprentissage par renforcement à partir de la rétroaction de l'IA).
- DeepSpeed, Accelerate ou FSDP pour l'entraînement de multiples unités de traitement graphique et l'apprentissage distribué.
- vLLM pour une inférence optimisée et le service de grands modèles.
- Weights & Biases (W&B) ou MLflow pour le suivi et la reproductibilité des expériences.
- LangChain, AutoGen (A2A) ou MCP pour le développement d'applications d'IA générative.
- PyTorch comme principal cadre d'apprentissage profond.
- Au moins trois ans d'expérience en ingénierie de l'apprentissage machine, en ingénierie des données ou en recherche appliquée (secteur d'activité ou milieu universitaire).
- Solides compétences en programmation Python et expérience avec des cadres comme PyTorch, TensorFlow, JAX.
- Expérience pratique avec les transformeurs de Hugging Face pour le préentraînement, l'affinage ou l'inférence.
- Expérience avec la bibliothèque TRL de Hugging Face pour l'affinage de l'apprentissage par renforcement (p. ex., optimisation des politiques proximales - PPO, optimisation directe des préférences - DPO, optimisation de la politique relative de groupe - GRPO, apprentissage par renforcement à partir de la rétroaction de l'IA).
- Expérience pratique dans la gestion de l'entraînement de multiples unités de traitement graphique et l'apprentissage distribué à grande échelle à l'aide de DeepSpeed, Accelerate ou FSDP.
- Expérience de l'inférence sur les grands modèles à l'aide de vLLM ou de cadres de service optimisés similaires.
- Bonne connaissance des outils de suivi et de reproductibilité des expériences (p. ex., W&B, MLflow).
- Connaissance des pratiques liées aux opérations d'apprentissage machine, incluant l'entraînement continu, la surveillance continue et la gestion du cycle de vie des modèles.
- Expérience des cadres d'IA générative comme LangChain, AutoGen (A2A) ou MCP.
- Capacité démontrée d'écrire du code propre, maintenable et prêt à la production.
- Expérience dans la création ou le soutien de systèmes d'IA infonuagiques (GCP, AWS ou Azure; certifications privilégiées).
- Solide connaissance de l'apprentissage par renforcement, du traitement automatique du langage naturel (TALN) ou de la modélisation générative (transformeurs, diffusion, génération améliorée par récupération d'information, etc.).
- Antécédents de contributions à la recherche (articles, brevets, projets de code source libre), un atout.
- Expérience en apprentissage par renforcement à partir de la rétroaction humaine ou de la rétroaction de l'IA.
- Contributions à des cadres d'IA de source libre.
- Bonne connaissance des lois d'échelle, des paramètres d'évaluation et de l'analyse comparative de grands modèles.
- Intérêt à repousser les limites de l'IA fiable, explicable et sécuritaire.
SAP as service providerWe use the following session cookies, which are all required to enable the website to function:
- "route" is used for session stickiness
- "careerSiteCompanyId" is used to send the request to the correct data center
- "JSESSIONID" is placed on the visitor's device during the session so the server can identify the visitor
- "Load balancer cookie" (actual cookie name may vary) prevents a visitor from bouncing from one instance to another
YouTubeYouTube is a video-sharing service where users can create their own profile, upload videos, watch, like, and comment on videos. Opting out of YouTube cookies will disable your ability to watch or interact with YouTube videos.Advertising CookiesThese cookies serve ads that are relevant to your interests. You may freely choose to accept or decline these cookies at any time. Note that certain functionality that these third parties make available may be impacted if you do not accept these cookies.Show More DetailsAdvertising Cookies Provider Description Enabled
LinkedInLinkedIn is an employment-oriented social networking service. We use the Apply with LinkedIn feature to allow you to apply for jobs using your LinkedIn profile. Opting out of LinkedIn cookies will disable your ability to use Apply with LinkedIn.AddThisGoogle Analytics is a web analytics service offered by Google that tracks and reports website traffic.