Page 1 sur 2

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 11:12
par Kronick
Yop les gars
sur ma tour home-made qui héberge esxi :love:
j'ai maintenant un problème depuis quelques semaines : le serveur s'arrête d'un coup !
J'ai d'autres serveurs sur la même prise secteur qui tournent sans problème. J'ai dépoussiéré le tout pour exclure un problème de chaleur, ça a arrangé les choses un peu, puisque le serveur a pu tourner une semaine et là, rebelotte

L'alim a deux ans, (cooler master m520 : http://www.ldlc.com/fiche/PB00064077.html) et le serveur a tourné 24/7 durant ces deux années. Quand je relance esxi, aucun message d'erreur, mais tout repart bien, les disques semblent être ok, puisqu' à la reprise tout marche. Je n'ai pas remarqué de comportement étrange sur la carte mère (j'accède bien au bios, les paramètres se sont pas réinitialisés, tout est reconnu), bref, c'est vraiment soudain, PAF le serveur s'arrête.
Les seuls changement que j'ai fait entre temps, c'est enlever la carte graphique (une 8600 gt) pour en mettre une plus légère (une 8400 gs), je ne pense pas que ça soit un problème de puissance, puisque l'équipement est très light sur le serveur :
- deux sata samsung de 1 to
- une msi neo K8N-neo4f
- 4 go de ram (enfin 3,5 reconnu d'ailleurs par le bios :sarcastic: )
- la CG
c'est tout :)

LDLC va la prendre en charge (garantie 5 ans) suite au diagnostic que je leur ai donné, mais je voulais avoir votre avis
merki

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 11:18
par X-System
Salut,

tu as dit que tu as plusieurs serveurs sur la même prise secteur. Ils font combien d'ampère au total ? Le disjoncteur de ta prise secteur est 16A ?

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 11:28
par Kronick
d'ampères je ne sais pas, mais en terme d'équipements, je suis loin de toucher aux 3520 watts que supporte un fusible 16A :
- un firewall cisco
- un proliant DL360 1u
- un écran
- un petit routeur d-link
- cette tour

je dirais à la louche 700 watts en tout :)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 11:34
par gizmo78
et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.

alim hs stou je dirais

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 12:43
par iori666
le serveur séteint ou reboot ?

-verifie les condos de la mobo
-monitore les temperatures
-propreté du serveur ? (surchauffe)
-memtest (probleme mémoire vive)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 12:54
par Kronick
le serveur s'éteint bien tout seul. Il est propre, j'ai vraiment dépoussiéré de fond en comble, les températures CPU sont assez basses (compter 40° en moyenne). Le seul truc qui chauffe c'est le rad passif de la CG
je vais tester mestest :jap:

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 13:16
par X-System
et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.

alim hs stou je dirais
Il m'est arrivé de couper une partie de l'électricité sur le disjoncteur à fusible quand on avait atteint plus de 3000 W (aspirateur 2000 W + perceuse pro sur la même prise secteur) alors la fusible n'est pas encore sautée...

Mais je n'avais pas pensé que des autres serveurs ne sont pas éteints.

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 13:21
par Ptitluc64
achète toi un ami qui aurait une alim a te prêter pour tester :D

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 17:16
par iori666
si probleme mémoire, sa reboot (memtest ne fera rien de plus pour ton diag :/ )

jpense à l'alim, ou alors la carte mere

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 2 août 2010 20:47
par Kronick
ça roule merci
à l'occase j'inspecterais la carte mère :)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 9 août 2010 16:13
par ZEPsikopat
Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?

Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 9 août 2010 17:52
par Zedoune
Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?

Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.

Si c'était ça, je pense pas que l'ordi planterait au bout de 5 minutes alors qu'il était froid ?

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 9 août 2010 18:07
par dsebire
j'ai une alim hyper qui coupe au bout de 3mn l'été.
c'est la sonde de température qui deconne !
ça tiens 10mn l'hiver :D

j'ai shunté la sonde, c moins secure mais ça tourne

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 9 août 2010 18:31
par X-System
Sans sonde, l'alim peut tenir sans problème la surpuissance :D

Je me rappelle mon ancien ordinateur qui était équipé Pentium 4A 1.8 avec la carte mère Abit AS7. Le reste des pièces était inchangé (la base était Pentium II) donc l'alimentation était générique ATX de 250 W sans prise 12V AUX.

Avec 5 disques durs dedans + GeForce 256 + 3 barrettes (plein puces par face), l'alimentation avait tenu pendant un an avant être H.S. :lol:

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : mar. 10 août 2010 10:13
par Kronick
bon ben le colis est parti chez ldlc, on verra tout ça :) heuresement qu'elle était garantie 5 ans tout de même :)
moi "'bonjour j'ai acheté une alim en 2008, elle marche plus" :lol:

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : dim. 12 sept. 2010 17:14
par Kronick
bon ben up, je me suis pris une jolie alim de 650w en spare (une corsair modulaire), et j'ai exactelement le même problème :(
je suspecte du coup la carte-mère, mais après inspection, rien n'est défectueux dessus à vue d'oeil.
Est-ce qu'il est possible que ça soit esxi qui plante ?

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : dim. 12 sept. 2010 21:32
par gizmo78
t'es sur de ton disque/ram/processeur??

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : dim. 12 sept. 2010 22:25
par Kronick
les disques ont vachement merdé à moment (j'ai du réparer l'array 2 fois), ce sont deux disques de 1to en raid 1.
Pour la ram, du coup je ne l'ai pas testé, pour iori, si ça avait été la ram, ça rebooterais , je suis d'accord avec ça.
Quand au proc, non, je ne sais pas si c'est ça qui pose problème

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 09:33
par dsebire
j'avais un comportement bizare jusqu'au mercredi dernier sur mon ESXi

VM qui crashent, ESX qui se plante (rarement) mais pas d'extinction de la machine (ni de reboot)

tout le monde (y compris des certifiés VMware) m'avait dit que si il y avait un problème materiel, c'est l'hyperviseur qui se tole, et pas le reste.

donc j'ai cherché longtemps avant de trouvé que j'avais une barette de RAM HS (2 puces sur les 16 de la barette)

perso, je pense pas a un problème soft (ESX) a moins que le système soit corrompu (la ou il y a l'hyperviseur d'installé)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 09:48
par Kronick
Oki, merci pour ce feedback :jap:
maintenant je suspecte deux choses :
- une des 4 barettes de RAM
- Esxi en dernier lieu.

Je me suis souvenu hier que ce problème a débuté le jour où un agent de EDF avait coupé chez moi sans prévenir pour installer leur nouveaux compteurs Linky.

Donc aujourd'hui je ne vais mettre qu'une barrette sur les 4 et alterner dès que ça plante :)
Si ça plante encore, je tenterais une réinstalle de esxi (ce qui rox c'est que le datastore n'est pas sur les mêmes DD, donc à part 10 mn de reconfiguration, c'est peanut :) )
encore merci :)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 10:20
par dsebire
fais comme moi, ça prends 2 sec:
memtest ;)

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 10:39
par Kronick
bon petite update, j'ai pu procéder par élimination. Mais le symptôme s'est reproduit :) alors j'ai testé chaque DD indépendamment en cassant le raid. en ne branchant que le 1er disque, le datastore était vide.
En branchant le 2e, le datastore était ok. C'est dont le disque 1 du raid qui merde.
Là j'ai les 4 barettes de RAM de branchées avec le disque 2, et pour le moment ça tourne.
Je vais formatter le DD depuis un autre poste, voir si tout va bien. Si ça passe je peux réintégrer ce DD dans le raid, ou mieux vaut-il que je prenne un autre DD ?

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 10:42
par dsebire
formattage bas niveau tant que possible + un check avec l'utilitaire du fabriquant si il existe.

si ok, tu le remets dans ton RAID et reteste.

pendant ce temps la, si ça a pas planté sur l'ESX sans le disque qui semble HS, c'est que le pb viens de la.
si ça replante en le reintégrant, poubelle

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : lun. 13 sept. 2010 10:47
par Kronick
bon ben up en fait, j'ai le même problème :lol:
quand j'ai lancé le démarrage de la 4e VM, ça a planté.
Je vais lancé memtest avec les 4 barettes et puis on verra bien
pfiou, say nul tout ça :o

Problème d\'alim ? : tour qui s\'éteint toute seule

Publié : mar. 14 sept. 2010 20:01
par Kronick
bon et bien j'ai retiré la carte mère que j'ai inspecté, j'ai trouvé 4 condensateurs bombés dont deux avec une trace noire au centre...
je pense qu'ils sont morts :
Image
Image

carte-mère hs ?
merci :)