
DevOps Senior
- Montreal, QC
- Permanent
- Full-time
- English Below
- Travailler avec des ingénieur.e.s de différentes disciplines pour aider à mettre en œuvre et à maintenir des systèmes massivement évolutifs et fiables
- Surveiller les performances et la fiabilité de l'infrastructure
- Concevoir et mettre en œuvre des plateformes Kubernetes à grande échelle
- Rédiger de la documentation concernant les systèmes et les processus
- Encadrer et accompagner les membres juniors de l'équipe
- Partager la responsabilité de l'astreinte avec les membres de l'équipe
- Posséder un solide état d'esprit orienté DevOps
- Optimiser la sécurité et atténuer les risques potentiels
- Etre résilient et disponible pour les mises en productions majeures
- Maximiser l'utilisation des ressources et participer à la planification des capacités
- Résoudre des problèmes et trouver des solutions créatives. Vous êtes orienté vers les résultats et les solutions
- Avoir un bon esprit d'équipe et faire preuve d'un esprit de collaboration
- Faire preuve d'autonomie, de rigueur et de curiosité à l'égard des nouvelles technologies
- Gérer son stress dans des situations critiques et problématiques
- S'adapter à des contextes variés
- S'engager à respecter la mission et les résultats du projet, en faisant appel à des horaires de travail flexibles si nécessaire.
- Communiquer efficacement avec les équipes en français et en anglais (l'anglais est essentiel pour collaborer avec les partenaires externes)
- Grande expérience sur des clusters Kubernetes non managés
- Connaissances avancées et expériences approfondies des API, CNI, CSI et CRI de K8s
- Expérience en planification et déploiement de backend en microservices à grande échelle avec Kubernetes en utilisant les méthodologies GitOps et IaaC sur des Clouds publics et/ou BareMetal
- À l'aise avec gRPC, HTTP/2 et Protocol Buffers
- Expérience avancée dans l'utilisation de Go, Python ou JS dans des projets cloud native
- Vaste expérience de l'exploitation de données en grappes, par exemple ElasticSearch, Kafka, MongoDB, RocksDB
- Vaste expérience de l'exploitation de services mesh ou de passerelles API en production
- Vaste expérience dans la concéption,la mise en œuvre et la maintenance de solutions de monitoring en production, par exemple Prometheus, Thanos, Mimir
- Expérience dans l'édition de jeux et/ou dans les boutiques HPC - un atout
- Work with engineers from various disciplines to help implement and maintain massively scalable and exceptionally reliable systems
- Help monitor and track performance and reliability of our services
- Help design and implement large scale Kubernetes platforms.
- Document systems and processes.
- Mentor junior team members.
- Share on-call responsibility with Publishing Technology team members.
- Demonstrate a strong DevOps culture.
- Continuously Improve security posture and mitigate risks.
- Adopt resilience and availability as essential deliverables.
- Maximize resources utilization in addition to participating in capacity planning.
- Solving problems and finding creative solutions. You are results and solution oriented.
- Being a good team player and showing a collaborative spirit
- Demonstrating autonomy, thoroughness and curiosity about new technologies
- Managing your stress in critical OR problematic situations
- Adapting to various contexts
- Commitment to the mission and deliverable of the project, leveraging flexible work hours when needed.
- Communicating effectively with teams in both French and English (English is essential in order to collaborate with external partners)
- Extensive experience running sophisticated workloads on unmanaged large Kubernetes clusters.
- Advanced knowledge and extensive experiences with K8s APIs, CNIs, CSIs & CRIs.
- Hands-on experience with planning and deploying large-scale microservices backend systems on k8s using GitOps and IaaC methodologies on Public Clouds and/or BareMetal.
- Familiarity with gRPC, HTTP/2 & Protocol Buffers.
- Advanced experience using Go, Python or JS in large scale cloud native projects.
- Extensive experiences running sharded/clustered data stores in Production. e.g. ElasticSearch, Kafka, MongoDB, RocksDB.
- Extensive experience running Services Meshes or API Gateways in Production.
- Extensive experience designing, implementing and maintaining multi-tried metrics backend in production e.g. Promethues, Thanos, Mimir.
- Experience in Game Publishing and/or HPC shops - an asset