Retour Problème technique du 27 Juin

Retour sur la maintenance et la panne technique de Vendredi 27 Juin


Suite à la demande de certains joueurs, nous souhaitons revenir sur la panne survenue le vendredi 27 juin à 21h40, qui a rendu nos serveurs de jeux inaccessibles pendant 24 heures.

La maintenance de 18h

Comme vous le savez, nous travaillons sans relâche pour améliorer votre expérience de jeu et minimiser autant que possible les lags et les délais de connexion. Pour ce faire, une maintenance était programmée le vendredi à 18h et devait durer 1h. L’objectif de cette opération était de transférer nos serveurs de connexion, de sécurité ainsi que nos IPs de l’hébergeur OVH à un hébergeur Annexe Privé. Cela permettrait de réduire les coûts mensuels tout en assurant un meilleur contrôle des infrastructures.

Cette maintenance, qui a duré 1h05 et s’est donc terminée à 19h05, a permis ce transfert et une nette amélioration du Ping Global du serveur a été constatée, ce qui nous a plus que ravis!

21h30, le chaos

Après plusieurs heures sans aucun problème, nous avons lancé la session RP du soir et nous nous apprêtions à atteindre notre pic de joueurs connectés, quand tout à coup, à 21h40 précisément, l’infrastructure de routage (le système de redirection de vos connexions vers notre IP de jeu) a lâché. La personne qui en est propriétaire n’était pas présente et donc indisponible pour un dépannage rapide.

À ce moment-là, Brokeos, notre technicien et la personne qui fait tourner tout rond sur le serveur, était lui aussi absent pour des raisons personnelles. Le reste de l’équipe, n’ayant aucune qualification ni connaissance en réseau et n’ayant pas non plus accès à la source du problème, nous étions coincés.

Pour faire simple, lorsque le serveur de routage est tombé, tous nos accès de gestion à distance sont aussi tombés. Aucun moyen de revenir à une configuration ou de passer sur nos systèmes de secours.

À 22h30, nous avons décidé de laisser la situation telle quelle jusqu’au retour de Brokeos et de notre nouveau fournisseur d’accès.

Samedi, 20h

Après une longue réflexion, une reprise de contrôle a été entamée et un retour chez OVH a été décidé avec une reconfiguration complète du serveur dans l’urgence pour vous assurer un retour du serveur dans les meilleurs délais.

Certains remarqueront que le temps d’action a été plutôt long, mais cela est dû au fait que nos actions sont régies par la disponibilité de chacun des membres du staff.

Le serveur a de nouveau été accessible à 21h30 et la coupure aura duré 23h50. Nous apprenons de nos erreurs, avons exprimé notre mécontentement à notre fournisseur d’accès quant à son temps de réaction et mettrons en place des mesures de précaution au cas où un événement similaire viendrait à se reproduire.

Nous savons que certains ont été frustrés de ne pas pouvoir jouer pendant 24h. Nous vous assurons que nous avons fait notre possible pour gérer ce problème le plus rapidement possible et continuerons de vous tenir informés de nos actions futures pour éviter des crises similaires.

Merci de votre compréhension et bonne aventure.


29 Juin 2024

Les Admins