Page 1 sur 2
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 11:12
par Kronick
Yop les gars
sur ma tour home-made qui héberge esxi

j'ai maintenant un problème depuis quelques semaines : le serveur s'arrête d'un coup !
J'ai d'autres serveurs sur la même prise secteur qui tournent sans problème. J'ai dépoussiéré le tout pour exclure un problème de chaleur, ça a arrangé les choses un peu, puisque le serveur a pu tourner une semaine et là, rebelotte
L'alim a deux ans, (cooler master m520 :
http://www.ldlc.com/fiche/PB00064077.html) et le serveur a tourné 24/7 durant ces deux années. Quand je relance esxi, aucun message d'erreur, mais tout repart bien, les disques semblent être ok, puisqu' à la reprise tout marche. Je n'ai pas remarqué de comportement étrange sur la carte mère (j'accède bien au bios, les paramètres se sont pas réinitialisés, tout est reconnu), bref, c'est vraiment soudain, PAF le serveur s'arrête.
Les seuls changement que j'ai fait entre temps, c'est enlever la carte graphique (une 8600 gt) pour en mettre une plus légère (une 8400 gs), je ne pense pas que ça soit un problème de puissance, puisque l'équipement est très light sur le serveur :
- deux sata samsung de 1 to
- une msi neo K8N-neo4f
- 4 go de ram (enfin 3,5 reconnu d'ailleurs par le bios

)
- la CG
c'est tout
LDLC va la prendre en charge (garantie 5 ans) suite au diagnostic que je leur ai donné, mais je voulais avoir votre avis
merki
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 11:18
par X-System
Salut,
tu as dit que tu as plusieurs serveurs sur la même prise secteur. Ils font combien d'ampère au total ? Le disjoncteur de ta prise secteur est 16A ?
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 11:28
par Kronick
d'ampères je ne sais pas, mais en terme d'équipements, je suis loin de toucher aux 3520 watts que supporte un fusible 16A :
- un firewall cisco
- un proliant DL360 1u
- un écran
- un petit routeur d-link
- cette tour
je dirais à la louche 700 watts en tout

Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 11:34
par gizmo78
et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.
alim hs stou je dirais
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 12:43
par iori666
le serveur séteint ou reboot ?
-verifie les condos de la mobo
-monitore les temperatures
-propreté du serveur ? (surchauffe)
-memtest (probleme mémoire vive)
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 12:54
par Kronick
le serveur s'éteint bien tout seul. Il est propre, j'ai vraiment dépoussiéré de fond en comble, les températures CPU sont assez basses (compter 40° en moyenne). Le seul truc qui chauffe c'est le rad passif de la CG
je vais tester mestest
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 13:16
par X-System
et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.
alim hs stou je dirais
Il m'est arrivé de couper une partie de l'électricité sur le disjoncteur à fusible quand on avait atteint plus de 3000 W (aspirateur 2000 W + perceuse pro sur la même prise secteur) alors la fusible n'est pas encore sautée...
Mais je n'avais pas pensé que des autres serveurs ne sont pas éteints.
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 13:21
par Ptitluc64
achète toi un ami qui aurait une alim a te prêter pour tester
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 17:16
par iori666
si probleme mémoire, sa reboot (memtest ne fera rien de plus pour ton diag :/ )
jpense à l'alim, ou alors la carte mere
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 2 août 2010 20:47
par Kronick
ça roule merci
à l'occase j'inspecterais la carte mère
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 9 août 2010 16:13
par ZEPsikopat
Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?
Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 9 août 2010 17:52
par Zedoune
Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?
Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.
Si c'était ça, je pense pas que l'ordi planterait au bout de 5 minutes alors qu'il était froid ?
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 9 août 2010 18:07
par dsebire
j'ai une alim hyper qui coupe au bout de 3mn l'été.
c'est la sonde de température qui deconne !
ça tiens 10mn l'hiver
j'ai shunté la sonde, c moins secure mais ça tourne
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 9 août 2010 18:31
par X-System
Sans sonde, l'alim peut tenir sans problème la surpuissance
Je me rappelle mon ancien ordinateur qui était équipé Pentium 4A 1.8 avec la carte mère Abit AS7. Le reste des pièces était inchangé (la base était Pentium II) donc l'alimentation était générique ATX de 250 W sans prise 12V AUX.
Avec 5 disques durs dedans + GeForce 256 + 3 barrettes (plein puces par face), l'alimentation avait tenu pendant un an avant être H.S.
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : mar. 10 août 2010 10:13
par Kronick
bon ben le colis est parti chez ldlc, on verra tout ça

heuresement qu'elle était garantie 5 ans tout de même

moi "'bonjour j'ai acheté une alim en 2008, elle marche plus"

Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : dim. 12 sept. 2010 17:14
par Kronick
bon ben up, je me suis pris une jolie alim de 650w en spare (une corsair modulaire), et j'ai exactelement le même problème

je suspecte du coup la carte-mère, mais après inspection, rien n'est défectueux dessus à vue d'oeil.
Est-ce qu'il est possible que ça soit esxi qui plante ?
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : dim. 12 sept. 2010 21:32
par gizmo78
t'es sur de ton disque/ram/processeur??
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : dim. 12 sept. 2010 22:25
par Kronick
les disques ont vachement merdé à moment (j'ai du réparer l'array 2 fois), ce sont deux disques de 1to en raid 1.
Pour la ram, du coup je ne l'ai pas testé, pour iori, si ça avait été la ram, ça rebooterais , je suis d'accord avec ça.
Quand au proc, non, je ne sais pas si c'est ça qui pose problème
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 09:33
par dsebire
j'avais un comportement bizare jusqu'au mercredi dernier sur mon ESXi
VM qui crashent, ESX qui se plante (rarement) mais pas d'extinction de la machine (ni de reboot)
tout le monde (y compris des certifiés VMware) m'avait dit que si il y avait un problème materiel, c'est l'hyperviseur qui se tole, et pas le reste.
donc j'ai cherché longtemps avant de trouvé que j'avais une barette de RAM HS (2 puces sur les 16 de la barette)
perso, je pense pas a un problème soft (ESX) a moins que le système soit corrompu (la ou il y a l'hyperviseur d'installé)
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 09:48
par Kronick
Oki, merci pour ce feedback

maintenant je suspecte deux choses :
- une des 4 barettes de RAM
- Esxi en dernier lieu.
Je me suis souvenu hier que ce problème a débuté le jour où un agent de EDF avait coupé chez moi sans prévenir pour installer leur nouveaux compteurs Linky.
Donc aujourd'hui je ne vais mettre qu'une barrette sur les 4 et alterner dès que ça plante

Si ça plante encore, je tenterais une réinstalle de esxi (ce qui rox c'est que le datastore n'est pas sur les mêmes DD, donc à part 10 mn de reconfiguration, c'est peanut

)
encore merci

Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 10:20
par dsebire
fais comme moi, ça prends 2 sec:
memtest

Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 10:39
par Kronick
bon petite update, j'ai pu procéder par élimination. Mais le symptôme s'est reproduit

alors j'ai testé chaque DD indépendamment en cassant le raid. en ne branchant que le 1er disque, le datastore était vide.
En branchant le 2e, le datastore était ok. C'est dont le disque 1 du raid qui merde.
Là j'ai les 4 barettes de RAM de branchées avec le disque 2, et pour le moment ça tourne.
Je vais formatter le DD depuis un autre poste, voir si tout va bien. Si ça passe je peux réintégrer ce DD dans le raid, ou mieux vaut-il que je prenne un autre DD ?
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 10:42
par dsebire
formattage bas niveau tant que possible + un check avec l'utilitaire du fabriquant si il existe.
si ok, tu le remets dans ton RAID et reteste.
pendant ce temps la, si ça a pas planté sur l'ESX sans le disque qui semble HS, c'est que le pb viens de la.
si ça replante en le reintégrant, poubelle
Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : lun. 13 sept. 2010 10:47
par Kronick
bon ben up en fait, j'ai le même problème

quand j'ai lancé le démarrage de la 4e VM, ça a planté.
Je vais lancé memtest avec les 4 barettes et puis on verra bien
pfiou, say nul tout ça

Problème d\'alim ? : tour qui s\'éteint toute seule
Publié : mar. 14 sept. 2010 20:01
par Kronick
bon et bien j'ai retiré la carte mère que j'ai inspecté, j'ai trouvé 4 condensateurs bombés dont deux avec une trace noire au centre...
je pense qu'ils sont morts :
carte-mère hs ?
merci
