Site Reliability Engineer - Observability

Montreal, QC
Permanent
Full-time

14 days ago
Apply easily

About Flinks 🚀Flinks is where financial data moves—with purpose, trust, and impact.We’re on a mission to simplify access to financial data and help businesses build better, faster, and more secure financial products and experiences. Since 2016, we’ve been bridging the gap between fintechs, financial institutions, and consumers by enabling seamless, secure data connectivity.From instant account funding to smarter lending, our solutions help power some of the most innovative financial products in North America. We partner with lenders, banks, and fintechs to streamline onboarding, prevent fraud, and fuel real-time decision-making with enriched, reliable data.As pioneers in Canada’s open banking movement, we're not waiting for the future—we're building it. If you're bold, curious, and ready to help shape the future of finance, we’d love to meet you.What You'll Be Doing 🔥As the Observability SRE, you will own the end-to-end observability, monitoring, and reliability strategy across all Flinks product lines. Your mission is to ensure every product—Data Connectivity, Payments, Enrichment, and Document Services—has the right telemetry, actionable alerts, and reliability insights.

Company-wide Observability & Monitoring: Define and maintain an observability framework across products; ensure coverage for APIs, scraping systems, payments, enrichment, and document services; establish SLIs/SLOs aligned to client expectations.
Alerting & Incident Management: Build consistent, low-noise alerting rules; integrate observability into Incident.io workflows; lead cross-product RCA; maintain a “single source of truth” for reliability metrics.
Reliability Analysis & Insights: Deliver monthly/quarterly scorecards linking reliability to client outcomes (e.g., churn risk, adoption blockers); analyze trends and recurring failures; translate data into executive insights.
Automation & AI-Enabled Observability: Automate anomaly detection, escalation, and self-healing; partner with the AI team; optimize logging and monitoring spend.
Collaboration & Enablement: Champion observability practices across teams; train PMs, QA, and Engineers; ensure insights influence roadmaps; collaborate with Tech Leadership to build observability in from the start.

Who You Are 💪

Experience: 5–8 years in SRE, Observability, or Reliability roles, ideally across multiple product environments (fintech, SaaS, or data platforms).
Technical Skills: Strong in observability tooling (Grafana, Prometheus, OpenTelemetry, ELK); Hands on experience with tracing and profiling tools (APM, OTEL, Pyroscope); experience with distributed systems, APIs, and data pipelines; strong automation skills (Kubernetes).
Strong programming skills with working knowledge of at least one programming language; C# and Go are preferred, but experience in other languages will also be considered valuable.
Mindset:

Systems thinker who sees the big picture.
Business-aware, connecting reliability to retention and profitability.
Proactive, anticipating failures before they occur.
Collaborative, working across product, QA, engineering, and reliability.

Great to haves

Experience in fintech or high-availability SaaS environments.
Familiarity with payments infrastructure and fraud detection systems.
Contributions to open-source observability tools or frameworks.

Why This Role Matters at Flinks 💡

Ensures all products have consistent reliability and observability standards.
Provides a single source of truth for performance and reliability across the org.
Directly improves client trust, profitability, and operational efficiency.
Enables proactive stability management across Flinks’ core product lines.
Supports our shift to a cohesive, reliable, platform-first mindset at scale.

The Interview Process 🏗

Head of People
Director of IT Ops
Technical Challenge
Panel Interview

À propos de Flinks 🚀Flinks est l’endroit où les données financières circulent — avec intention, confiance et impact.Notre mission est de simplifier l’accès aux données financières et d’aider les entreprises à bâtir des produits et des expériences financières meilleurs, plus rapides et plus sécurisés. Depuis 2016, nous comblons le fossé entre les fintechs, les institutions financières et les consommateurs en permettant une connectivité aux données fluide et sécurisée.De l’alimentation instantanée de comptes aux prêts plus intelligents, nos solutions propulsent certains des produits financiers les plus innovants en Amérique du Nord. Nous collaborons avec des prêteurs, des banques et des fintechs pour simplifier l’intégration, prévenir la fraude et alimenter la prise de décision en temps réel grâce à des données fiables et enrichies.En tant que pionniers du mouvement de l’open banking au Canada, nous n’attendons pas l’avenir — nous le construisons. Si vous êtes audacieux·se, curieux·se et prêt·e à contribuer à façonner l’avenir de la finance, nous serions ravis de vous rencontrerCe que vous ferez 🔥En tant que SRE Observabilité, vous serez responsable de la stratégie d’observabilité, de surveillance et de fiabilité de bout en bout pour toutes les lignes de produits de Flinks. Votre mission est de garantir que chaque produit — Connectivité de données, Paiements, Enrichissement et Services de documents — dispose de la bonne télémétrie, d’alertes exploitables et d’indicateurs de fiabilité.

Observabilité et surveillance à l’échelle de l’entreprise : Définir et maintenir un cadre d’observabilité à travers les produits; assurer la couverture des API, systèmes de scraping, paiements, enrichissement et services documentaires; établir des SLIs/SLOs alignés sur les attentes des clients.
Alertes et gestion des incidents : Construire des règles d’alerte cohérentes et à faible bruit; intégrer l’observabilité dans les flux de travail Incident.io; diriger les RCA inter-produits; maintenir une “source unique de vérité” pour les métriques de fiabilité.
Analyse et insights de fiabilité : Produire des rapports mensuels/trimestriels reliant la fiabilité aux résultats clients (ex. : risque de churn, freins à l’adoption); analyser les tendances et échecs récurrents; traduire les données en insights stratégiques pour la direction.
Automatisation et observabilité augmentée par l’IA : Automatiser la détection d’anomalies, l’escalade et l’auto-réparation; collaborer avec l’équipe IA; optimiser les coûts de journalisation et de monitoring.
Collaboration et accompagnement : Promouvoir les bonnes pratiques d’observabilité dans toutes les équipes; former les PM, QA et Ingénieurs; s’assurer que les insights influencent les roadmaps; collaborer avec la direction technologique pour intégrer l’observabilité dès la conception.

Profil recherché 💪Expérience

5 à 8 ans d’expérience en SRE, Observabilité ou Fiabilité, idéalement dans des environnements multi-produits (fintech, SaaS ou plateformes de données).

Compétences techniques

Solide maîtrise des outils d’observabilité (Grafana, Prometheus, OpenTelemetry, ELK).
Expérience pratique avec les outils de traçage et de profilage (APM, OTEL, Pyroscope).
Connaissance des systèmes distribués, des APIs et des pipelines de données.
Compétences avancées en automatisation (Kubernetes).
Solides compétences en programmation, avec maîtrise d’au moins un langage; C# et Go sont privilégiés, mais l’expérience avec d’autres langages est également valorisée.

État d’esprit

Penseur systémique, capable de voir la vue d’ensemble.
Orienté affaires, reliant fiabilité à rétention et rentabilité.
Proactif, anticipant les défaillances avant qu’elles ne surviennent.
Collaboratif, travaillant à travers Produit, QA, Ingénierie et Fiabilité.

Atouts

Expérience dans la fintech ou les environnements SaaS haute disponibilité.
Familiarité avec l’infrastructure de paiements et les systèmes de détection de fraude.
Contributions à des outils ou frameworks d’observabilité open source.

Pourquoi ce rôle est essentiel chez Flinks 💡

Garantit que tous les produits disposent de normes de fiabilité et d’observabilité cohérentes.
Fournit une source unique de vérité pour la performance et la fiabilité à travers l’organisation.
Améliore directement la confiance des clients, la rentabilité et l’efficacité opérationnelle.
Permet une gestion proactive de la stabilité pour les lignes de produits principales de Flinks.
Soutient notre passage à une mentalité cohérente, fiable et platform-first à grande échelle.

Flinks

We are sorry but this recruiter does not accept applications from abroad.