Page 1481 sur 3348

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 13:29
par mosie
pong
Commentaire de OVH - mercredi, 28 mars 2012, 19:48

Bonjour,
Nous avons eu un problème de routage cette nuit dû
à un bug software qui touchent 2 routeurs principaux
de Roubaix. Ces Cisco ASR 9010 assurent la collecte
de la bande passante des datacentres à Roubaix (RBX1
RBX2 RBX3 RBX4 RBX5) et la connexion vers Paris,
Bruxelles, Amsterdam, London et Frankfurt. En bref,
le coeur de routage à Roubaix.

Ce bug là est connu et il est lié aux nouvelles cartes
que nous avons mis en production fin janvier (24x10G par
slot). Pour une raison random la carte se met à détecter
des erreurs RAM ECC et ne route plus les packets. Mais
surtout malgré cela la carte ne se déclare pas "en panne"
et reste dans le routeur comme si elle était bonne.
Les autres routeurs continuent à envoyer les packets
mais en face il n'y a personne. Tout tombe dans un trou
noir et le réseau ne fonctionne plus correctement.
Le pire de cas: une panne pas net.

Cette nuit, 3 cartes 24x10G sur 2 routeurs ASR 9010
ont eu ce bug là presque en même temps. Ceci a cassé
le réseau en 3 morceaux: USA/London/Amsterdam/Varsovie,
Roubaix et Paris, Frankfurt, Madrid, Milano, en aspirant
les packets à Roubaix. Habituellement le trafic aurait
été rerouté mais là il a été aspiré et bloqué à Roubaix.

Du coup nous n'avons pas pu exploiter le réseau pour
administrer ce réseau et récupérer logs de tous les
routeurs afin de connaître l'origine du problème.
Nous avons navigué à l'ancienne, avec les connexions
de secours/extérieur pour se connecter sur chaque
routeur de backbone pour vérifier si c'est le routeur
qui est à l'origine du problème. Cette opération a
pris du temps, car en plus deux routeurs se sont mis
en panne et on avait mis du temps à comprendre que
ça ne venait pas juste d'un routeur rbx-g2-a9 mais aussi
à cause de rbx-g1-a9. Une fois que nous avons redémarré
les 3 cartes tout est revenu en 5 minutes.

Il y a environ 3 semaines. Nous avons déjà ouvert un
ticket au près de Cisco concernant ce problème de RAM
ECC. Cisco a travaillé sur le problème et a pu nous
fournir .. ce matin le patch software à appliquer sur
les routeurs afin de fixer ce problème là. On va
réaliser cette opération cette nuit. Pas de panne à
prévoir.

On regarde aussi comment améliorer la gestion de nos
routeurs dans le cas où toute la backbone est down
pour une raison qui n'arrive jamais. On sait gérer
ce cas de figure mais c'est lent. Très lent.

Dans tous les cas, la panne a durée plus que 99.9%
à savoir 1h22 alors qu'on a "droit" à 43 min par
mois de downtime. Il y a donc les pénalités qui se
déclenche pour le dépassement du temps autorisé.
Exemple: sur les SD OVH c'est 5% par heure d'indisponibilité.
Nous allons faire un URL afin que vous puissiez
déclencher le SLA et nous envoyer le doc pour créditer
les 5% du temps sur votre service. Il sera posté dans
le task http://travaux.ovh.com/?do=details&id=6533

C'est jamais agréable d'écrire ce genre d'email mais
quand on n'est pas bon, bahh, on l'assume et on
s'excuse.

Désolé encore.

Amicalement
Octave
:pt1cable: :pt1cable: :pt1cable:
http://travaux.ovh.net/?do=details&id=6533
Merde clair que mail bien sympa et précis sur les cause du problème.
intéressant.

On reconnaitrai presque la un GEEK HW :)

Clair que si on pouvez toujours avoir ce genre de mail plutôt que des truc formel de 4 ligne avec le bon vieux: ''veuillez agréer mes sincère salutation bbouua ...
Il pinG bien Octave. :lol:

sinon outch le prix du Cisco ASR 9010 :pfff:

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 13:44
par kalistyan
...les causes du problème.
...On reconnaîtrait...
...que si l'on pouvait...des trucs...de 4 lignes... veuillez agréer l'expression de mes plus sincères salutations.

[:cupra]

Pong

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 14:05
par poulpito
ping si ils pouvaient tous reconnaitre comme ca .. ce serait magnifique

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 14:13
par Kronickoo
pong avatars validés :sol:

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 14:13
par sylver52
ping

GG raf, c'est un CDD ou intérim ?

C'est clair que certaines phrases sont un peu brouillon mais osef, il explique super bien le problème donc c'est plutôt cool. Et comme le dit poulpi, si toutes les entreprises faisaient la même chose, ça serait pas mal ;)

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 14:14
par sylver52
pong avatars validés :sol:
pong

Je file voir celui de mosie, depuis le temps qu'il couine pour qu'il soit validé :D

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 14:45
par mosie
pong avatars validés :sol:


GG .
par contre mon .gif passe pas :(
Image

COOUIINNN cooiuiiiinnn ! pinG

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 15:11
par Zedoune
C'est qui sur ton avatar ? Dimmu Borgir et ?

pong!

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 15:23
par mosie
aucune idée :(

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 15:47
par sylver52
pong

Fait peur ton avatar mosie ^^

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 16:00
par Zedoune
pong

Fait peur ton avatar mosie ^^
J'en connais une qui a que des posters comme ça dans sa chambre. C'est mignon la nuit :love:
Oh zut, c'est vrai, je vis avec :lol:

ping

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 16:31
par kalistyan
:ouch:

Pong

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 16:54
par sylver52
ping

Les cauchemars que je ferai truc de dingue :D

Yeah, j'arrive à synchroniser une vidéo avec une source de lumière programmable :D

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 17:24
par Kronickoo
pong c'est quoi cet avatar :lol:

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 17:29
par poulpito
ping
ovh me saoule
depuis 2h du mat mon serveur est plus accessible ... fuck quoi !

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 17:33
par kalistyan
Commence à faire long... :/

Pong

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 17:58
par Zedoune
J'ai de la chance, chez OVH mes 5 serveurs ont juste eu une petite coupure hier à 4h

ping

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:02
par mosie

J'en connais une qui a que des posters comme ça dans sa chambre. C'est mignon la nuit :love:
Oh zut, c'est vrai, je vis avec :lol:

ping
:ouch: tain vous avez des nana qui ROXXX pong :lol:

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:02
par poulpito
bah ils tourennt toujours et remonte des infos à l'interface d'admin
ils pinguent toujours mais pas moyen d'y accéder :/
j'ai pas envie de lui foutre un reboot hard dans le cul tant que je suis sur que ca vient pas de moi quoi :(

pong

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:20
par kalistyan

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:49
par sylver52

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:50
par poulpito
ping déjà vu juste énormissime :D

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 18:58
par gizmo78
quand y recharge la cheminée avec des chatons :lol:

pong

ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 19:13
par Zedoune

:ouch: tain vous avez des nana qui ROXXX pong :lol:
ping

J'aime ma nana qui porte des clous et qui s'habille toujours en noir :love:


ριиg σr ρσиg ? Côté obscur

Publié : jeu. 29 mars 2012 19:17
par kalistyan
:lol: Pong

Va adorer cette vidéo !