Retour aux études de cas
Machine Learning

Maintenance prédictive des commutateurs basée sur l'AI

Médias, divertissement et sport
image alt

"Avant ce projet, prévoir les défaillances matérielles dans notre infrastructure RTN semblait irréaliste. Mais Artificialy a prouvé qu'une anticipation pertinente n'est pas seulement possible, elle est pratique. Le système a identifié les dysfonctionnements à venir plusieurs jours à l'avance, ce qui a donné à nos ingénieurs plus de temps pour réagir et éviter les perturbations. Il s'agit d'une étape prometteuse vers une gestion plus proactive et plus intelligente de l'infrastructure, et nous sommes impatients de voir ce que cela peut donner."

Le Défi

Le client gère un réseau RTN qui constitue l'épine dorsale de son infrastructure, garantissant la fiabilité de la diffusion des services vidéo, de données et Internet. Ce système à haute capacité dépend de dizaines de commutateurs critiques. Toute défaillance ou dégradation des performances de l'un de ces commutateurs peut nuire à l'expérience client et, dans le pire des cas, entraîner une interruption totale du service.

Bien que le client ait récemment mis en place un nouveau système de surveillance permettant de suivre des centaines de paramètres par commutateur, il ne disposait d'aucun moyen d'anticiper les problèmes avant qu'ils ne deviennent critiques.

Disposant de grands volumes de données à haute fréquence, mais sans outils prédictifs, il avait besoin d'une approche basée sur l'AI pour passer d'une maintenance réactive à une maintenance proactive.

side by side section image

Un acteur du secteur des médias et du divertissement : l'une des radios et télévisions suisses les plus célèbres, opérant dans la partie italophone de la Suisse.

side by side section image

Notre solution basée sur l'AI

En quelques mois, nous avons développé un moteur de détection des anomalies sur mesure, conçu pour identifier les signes avant-coureurs de pannes matérielles sur l'ensemble de l'infrastructure RTN critique.

Chaque commutateur surveillé transmet environ 800 caractéristiques, notamment l'utilisation du processeur, le trafic de l'interface, la température, les mesures de puissance, etc. Il en résulte des gigaoctets de données télémétriques à haute fréquence réparties sur des commutateurs de différents types et configurations.

La solution a été conçue pour répondre à trois objectifs principaux :

  • Évolutivité : le système traite efficacement de grands volumes de données chronologiques, même avec des taux d'échantillonnage irréguliers et des lacunes, et peut être rapidement adapté pour prendre en charge des commutateurs supplémentaires ou de nouveaux types de commutateurs.

  • Détection sur mesure : la solution applique une logique personnalisée pour chaque type de commutateur et chaque type d'événement, ce qui permet une détection précise des différents dysfonctionnements tout en minimisant les alertes fausses ou non pertinentes.

  • Explicabilité : pour chaque avertissement, le modèle met en évidence les métriques qui ont présenté un comportement anormal, ce qui permet aux ingénieurs de comprendre et de vérifier les anomalies sans se fier aux prédictions d'une boîte noire.

Le système a été déployé dans l'environnement interne du client, où il s'intègre désormais à sa pile de surveillance afin de fournir des alertes en temps réel en cas de dysfonctionnements potentiels des commutateurs.

Résultats

Bien que la solution d'Artificialy soit encore en cours d'évaluation en production, les tests hors ligne ont déjà montré un fort potentiel :

  • ~50 % des événements critiques détectés , avec un délai moyen de 11 jours, ce qui donne aux ingénieurs un temps précieux pour enquêter et prévenir les interruptions de service.

  • ~50 % de fausses alertes , en accord avec la capacité opérationnelle du client pour la vérification manuelle.

  • Base évolutive : cette solution jette les bases de développements futurs, notamment la notation de la gravité, le réglage automatique et les modèles avancés.

side by side section image