Aller au contenu

Ne laissez pas une panne de TI devenir votre prochain défi de relations publiques

Shutterstock 526316296

Si vous avez perdu votre service mobile ou Internet en juillet, vous n’êtes pas seul

Des millions d’abonnés se sont retrouvés sans service cellulaire et Internet à compter du 8 juillet, certains n’ayant pas rétabli le service avant la fin de semaine. La cause? Une défaillance massive du système réseau liée à une mise à jour de maintenance dans le réseau central d’un fournisseur. Et même si la perte des services souscrits des clients est déjà assez grave, la panne a touché des endroits que vous ne vous attendiez peut-être pas – avec des conséquences dévastatrices.

Cette panne n’était pas la première du genre non plus. Les Canadiens ont connu une panne de service semblable en avril 2021. De plus, la grande majorité du temps consacré à la résolution d’un problème est axée sur la détermination de la cause de la panne.

Bien que ces pannes aient été très publiques, les incidents importants dans les grandes organisations sont plus fréquents qu’on pourrait le croire, près du tiers des propriétaires ou des exploitants de centres de données ayant signalé un incident d’indisponibilité ou une détérioration grave du service au cours de l’année précédente•.

Alors, que peut-on faire pour prévenir ce genre de panne – et rétablir rapidement et efficacement les services en cas de panne?

La première chose que les organisations doivent faire, c’est d’empêcher le problème de se produire. Dans les cas où la panne a coûté plus d’un million de dollars, 74 % des propriétaires ou exploitants de centres de données qui ont répondu à une étude de 2019 ont déclaré que leur plus récent incident important d’indisponibilité aurait pu être évité grâce à une meilleure gestion, à de meilleurs processus ou à une meilleure configuration. Deuxièmement, lorsqu’un incident se produit, ces mêmes processus de gestion feront en sorte que le temps de résolution sera beaucoup plus rapide.

Avec de nombreux changements qui se produisent tôt le matin ou tard le soir, l’erreur humaine est souvent encore plus difficile à résoudre, car la plupart des employés ne travaillent pas. Toutefois, les propriétaires et les exploitants de centres de données qui utilisent la solution DCIM de BGIS Cormant ont accès à des données complètes pour prendre des décisions plus éclairées lors de la planification, puis confirmer ces changements en temps réel à l’aide de la numérisation des appareils mobiles. Avec de grandes données, l’erreur humaine et les incidents qu’ils causent peuvent être considérablement réduits.

Lorsqu’une erreur s’est produite, la solution réactive de DCIM de BGIS Cormant peut être la différence entre une brève interruption de service pour une petite fraction des abonnés et des utilisateurs ou une catastrophe nationale, voire internationale, qui paralyse les activités commerciales et les services publics essentiels pendant des heures, voire des jours. Découvrir la source du problème est un processus lent lorsqu’il est fait manuellement; souvent, une grande partie est de trouver physiquement l’appareil. Avec le DCIM de BGIS, le dispositif défectueux sera trouvé en quelques secondes, et non en heures. Une partie de la solution DCIM de BGIS Cormant est une solution mobile riche en données qui suit et gère les éléments du centre de données, identifie les actifs nécessitant une attention et signale les exigences nécessaires pour les réparer.

Paul Goodison, vice-président, Solutions d’infrastructure technologique pour BGIS, souligne la nécessité de la gestion de l’infrastructure de TI dans les secteurs public et privé au Canada. « Nous savons que les solutions Cormant de BGIS permettent aux clients canadiens de nombreuses organisations gouvernementales, provinciales, éducatives et du secteur privé de fournir des services plus fiables et résilients à leurs clients en évitant les problèmes. »

BGIS est le développeur de Cormant-CS, une solution DCIM complète avec près de 20 ans d’expérience sur le marché canadien. Le Cormant-CS fournit des données d’infrastructure en temps réel qui sont utilisées pour accroître l’efficacité et réduire les temps d’arrêt. Grâce au système automatisé d’alerte, à la gestion du changement et à la documentation en temps réel, ainsi qu’aux rapports continus, l’environnement physique est constamment suivi.

La facilité d’utilisation, la fiabilité inégalée et les options d’intégration sans fin sont la raison pour laquelle BGIS Cormant est la meilleure solution DCIM au monde et la meilleure solution ITIM et DCIM au Canada depuis 2003. Avec une vue globale unique de l’environnement physique du centre de données, y compris chaque connexion, appareil, rack et pièce sur un tableau de bord facile à gérer, Cormant-Le CS facilite la surveillance pour repérer et résoudre rapidement les problèmes – ce qu’aucune solution de surveillance du réseau n’offre.

Cliquez ici pour communiquer avec nous ou parler à votre personne-ressource habituelle de BGIS pour obtenir une consultation sur la façon dont BGIS aidera votre organisation à améliorer la résilience et la redondance dans vos centres de données et vos réseaux d’entreprise.

¨ Uptime Institute, September 23, 2019: “How to avoid outages: Try harder!”