Decathlon : L’Observabilité comme enjeu stratégique de l’encaissement

Chez Decathlon, encaisser un client ne se résume pas à valider un panier. C’est l’aboutissement d’un parcours, d’une expérience en magasin, et très souvent… d’un moment sportif partagé. Alors quand 80 % du chiffre d’affaires mondial repose sur ce simple geste, on comprend vite que l’encaissement est un maillon stratégique.

C’est ce que Julien Picquet, Engineering Manager chez Decathlon, et en charge de l’infrastructure et du hardware pour l’encaissement, est venu présenter lors de la dernière édition de l’Apér’OBS.

Le contexte : L’encaissement, un enjeu critique

Aujourd’hui, on compte 13 300 caisses réparties dans 1 754 magasins et 74 pays. Et ce chiffre grimpera à 15 000 caisses d’ici deux ans. L’enjeu est de garantir une expérience d’encaissement rapide, fiable, sécurisée et homogène, peu importe où l’on se trouve dans le monde.

Pour y parvenir, l’équipe infrastructure encaissement de Decathlon poursuit une vision ambitieuse, centraliser la gouvernance, tout en standardisant le matériel, le système d’exploitation, et les outils de monitoring. Le tout, avec une attention particulière portée aux technologies de demain, comme la RFID.

Le problème : Une Observabilité fragmentée et inefficace

Comme souvent dans les grandes organisations, les outils d’observabilité étaient silotés. Chaque équipe ( réseau, applicatif, support, matériel) avait ses propres métriques, ses propres dashboards. En cas d’incident, impossible de suivre un parcours utilisateur de bout en bout. Trouver la cause racine devenait un jeu de piste chronophage, où chacun voyait une partie du problème, mais rarement le tout.

À cela s’ajoutaient plusieurs couches complexes :

  • Dix solutions d’encaissement différentes selon les pays et les magasins,
  • Une jungle de périphériques à surveiller : imprimantes, tiroirs-caisses, lecteurs RFID, TPE,
  • Des règles fiscales locales qui dictent la manière dont les paiements doivent être traités.

Bref, une équation à plusieurs inconnues… à résoudre chaque jour.

Le projet : Une plateforme d’Observabilité unifiée

Face à ce constat, un projet ambitieux est lancé à l’été 2023, créer une plateforme d’observabilité unifiée pour toutes les caisses du réseau.
L’approche choisie est pragmatique, collective, et pensée comme un produit à part entière.

Trois grands objectifs structurent le projet :

1. Augmenter la Disponibilité et la Fiabilité :

  • Augmenter le taux de disponibilité des caisses.
  • Réduire le MTTR (Mean Time To Resolve), c’est-à-dire le temps moyen de résolution des incidents.

2. Détection Proactive et Auto-remédiation :

  • Détecter les problèmes avant qu’ils ne soient remontés par les utilisateurs en magasin.
  • Mettre en place des actions correctives automatiques (ex: redémarrer un service qui a planté sur une caisse).
  • Réduire le nombre de tickets d’incidents ouverts auprès des centres de support (Helpdesk).

3. Équilibre Coût / Valeur (Approche FinOps) :

  • Maîtriser les coûts. Une solution standard (agent Datadog sur chaque caisse) avait été estimée à 8 millions d’euros, un budget irréaliste pour l’équipe.
  • Penser la plateforme comme un produit avec un Product Manager (PM) dédié, afin de s’assurer que chaque investissement crée une valeur mesurable.
Une architecture hybride, pensée pour l’échelle

L’architecture a été conçue pour être à la fois puissante et économe.

Sur les caisses : du local, du léger, de l’intelligent.

Des scripts développés en interne collectent les logs du système et des périphériques. Un agent OpenTelemetry se charge ensuite de standardiser, enrichir et pré-traiter ces données directement sur la caisse.
Cette approche locale est maligne : elle limite les volumes de données envoyées et exploite les ressources déjà disponibles sur les terminaux.

En central : un pipeline bien huilé

Les données transitent ensuite vers un pipeline centralisé, également basé sur OpenTelemetry, qui trie, agrège et achemine les bons signaux vers les bons outils :

  • Datadog, pour le dashboarding, les alertes et bientôt l’auto-remédiation,
  • Un Data Lake, pour croiser les données techniques avec les données métiers (par exemple, analyser les liens entre incidents techniques et pertes de chiffre d’affaires).

Une organisation en soutien du projet

Ce type de transformation ne peut réussir sans une organisation dédiée. C’est pourquoi une équipe d’Observabilité a été créée, avec pour mission de porter l’expertise, mutualiser les efforts, et construire une plateforme vivante, pensée comme un produit évolutif.

Et parce qu’une plateforme, aussi performante soit-elle, n’est utile que si elle est bien utilisée, les équipes locales sont formées et accompagnées, pour en tirer le meilleur au quotidien.

La feuille de route jusqu’en 2025

  • Fin 2023 : premières expérimentations, MVP, tests terrain.
  • 2024 : industrialisation, déploiement dans plusieurs pays pilotes, formation des équipes.
  • Fin 2025 : objectif de déploiement complet sur les deux principales solutions d’encaissement dans tous les pays.
Ce qu’on peut en retenir

  1. Construire une observabilité utile, ce n’est pas empiler des dashboards, c’est comprendre les vrais parcours utilisateurs.
  2. Prétraiter les données localement, c’est la clé pour garder un budget maîtrisé, sans sacrifier la qualité des insights.
  3. Une équipe dédiée et une gouvernance produit permettent de rester aligné sur la valeur métier.
  4. Et surtout, tout cela n’est pas qu’une affaire de technique. C’est un projet qui touche l’humain, l’expérience client, et l’excellence opérationnelle à grande échelle.