Problème d'alim ? : tour qui s'éteint toute seule

Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

Yop les gars
sur ma tour home-made qui héberge esxi :love:
j'ai maintenant un problème depuis quelques semaines : le serveur s'arrête d'un coup !
J'ai d'autres serveurs sur la même prise secteur qui tournent sans problème. J'ai dépoussiéré le tout pour exclure un problème de chaleur, ça a arrangé les choses un peu, puisque le serveur a pu tourner une semaine et là, rebelotte

L'alim a deux ans, (cooler master m520 : http://www.ldlc.com/fiche/PB00064077.html) et le serveur a tourné 24/7 durant ces deux années. Quand je relance esxi, aucun message d'erreur, mais tout repart bien, les disques semblent être ok, puisqu' à la reprise tout marche. Je n'ai pas remarqué de comportement étrange sur la carte mère (j'accède bien au bios, les paramètres se sont pas réinitialisés, tout est reconnu), bref, c'est vraiment soudain, PAF le serveur s'arrête.
Les seuls changement que j'ai fait entre temps, c'est enlever la carte graphique (une 8600 gt) pour en mettre une plus légère (une 8400 gs), je ne pense pas que ça soit un problème de puissance, puisque l'équipement est très light sur le serveur :
- deux sata samsung de 1 to
- une msi neo K8N-neo4f
- 4 go de ram (enfin 3,5 reconnu d'ailleurs par le bios :sarcastic: )
- la CG
c'est tout :)

LDLC va la prendre en charge (garantie 5 ans) suite au diagnostic que je leur ai donné, mais je voulais avoir votre avis
merki
Avatar de l’utilisateur
X-System
Messages : 6843
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par X-System »

Salut,

tu as dit que tu as plusieurs serveurs sur la même prise secteur. Ils font combien d'ampère au total ? Le disjoncteur de ta prise secteur est 16A ?
PC1 = MW70-3S0 # 2x E5-2689 v4 # 32Go DDR4-2400 ECC reg # RTX 3080 Ti # 2x1To SSD
PC2 = Z170XP-SLI # i7-7700 # 32Go DDR4-2400 # 240Go NVMe # SAS9211-8i # 10 SSD/HDD SATA # LTO-5 SAS
PC3 = T460p # i7-6700HQ # 16Go DDR4-2133 # 940MX # 240Go SSD
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

d'ampères je ne sais pas, mais en terme d'équipements, je suis loin de toucher aux 3520 watts que supporte un fusible 16A :
- un firewall cisco
- un proliant DL360 1u
- un écran
- un petit routeur d-link
- cette tour

je dirais à la louche 700 watts en tout :)
gizmo78
Messages : 20534
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par gizmo78 »

et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.

alim hs stou je dirais
iori666
Messages : 3121
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par iori666 »

le serveur séteint ou reboot ?

-verifie les condos de la mobo
-monitore les temperatures
-propreté du serveur ? (surchauffe)
-memtest (probleme mémoire vive)
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

le serveur s'éteint bien tout seul. Il est propre, j'ai vraiment dépoussiéré de fond en comble, les températures CPU sont assez basses (compter 40° en moyenne). Le seul truc qui chauffe c'est le rad passif de la CG
je vais tester mestest :jap:
Avatar de l’utilisateur
X-System
Messages : 6843
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par X-System »

et puis si c'était le disjoncteur il n'y aurait pas que ton serveur de touché.

alim hs stou je dirais
Il m'est arrivé de couper une partie de l'électricité sur le disjoncteur à fusible quand on avait atteint plus de 3000 W (aspirateur 2000 W + perceuse pro sur la même prise secteur) alors la fusible n'est pas encore sautée...

Mais je n'avais pas pensé que des autres serveurs ne sont pas éteints.
PC1 = MW70-3S0 # 2x E5-2689 v4 # 32Go DDR4-2400 ECC reg # RTX 3080 Ti # 2x1To SSD
PC2 = Z170XP-SLI # i7-7700 # 32Go DDR4-2400 # 240Go NVMe # SAS9211-8i # 10 SSD/HDD SATA # LTO-5 SAS
PC3 = T460p # i7-6700HQ # 16Go DDR4-2133 # 940MX # 240Go SSD
Ptitluc64
Messages : 320
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Ptitluc64 »

achète toi un ami qui aurait une alim a te prêter pour tester :D
iori666
Messages : 3121
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par iori666 »

si probleme mémoire, sa reboot (memtest ne fera rien de plus pour ton diag :/ )

jpense à l'alim, ou alors la carte mere
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

ça roule merci
à l'occase j'inspecterais la carte mère :)
ZEPsikopat
Messages : 3386
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par ZEPsikopat »

Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?

Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.
Avatar de l’utilisateur
Zedoune
Messages : 15343
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Zedoune »

Surchauffe mosfet de la carte mère ? Ou surchauffe du chipset ?

Regarde dans le bios si tu n'as pas un réglage un peu agressif pour la température critique de coupure.

Si c'était ça, je pense pas que l'ordi planterait au bout de 5 minutes alors qu'il était froid ?
Avatar de l’utilisateur
dsebire
Messages : 13160
Inscription : ven. 12 janv. 2018 17:44
Localisation : Loiret - entre la ville et les champs

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par dsebire »

j'ai une alim hyper qui coupe au bout de 3mn l'été.
c'est la sonde de température qui deconne !
ça tiens 10mn l'hiver :D

j'ai shunté la sonde, c moins secure mais ça tourne
Avatar de l’utilisateur
X-System
Messages : 6843
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par X-System »

Sans sonde, l'alim peut tenir sans problème la surpuissance :D

Je me rappelle mon ancien ordinateur qui était équipé Pentium 4A 1.8 avec la carte mère Abit AS7. Le reste des pièces était inchangé (la base était Pentium II) donc l'alimentation était générique ATX de 250 W sans prise 12V AUX.

Avec 5 disques durs dedans + GeForce 256 + 3 barrettes (plein puces par face), l'alimentation avait tenu pendant un an avant être H.S. :lol:
PC1 = MW70-3S0 # 2x E5-2689 v4 # 32Go DDR4-2400 ECC reg # RTX 3080 Ti # 2x1To SSD
PC2 = Z170XP-SLI # i7-7700 # 32Go DDR4-2400 # 240Go NVMe # SAS9211-8i # 10 SSD/HDD SATA # LTO-5 SAS
PC3 = T460p # i7-6700HQ # 16Go DDR4-2133 # 940MX # 240Go SSD
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

bon ben le colis est parti chez ldlc, on verra tout ça :) heuresement qu'elle était garantie 5 ans tout de même :)
moi "'bonjour j'ai acheté une alim en 2008, elle marche plus" :lol:
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

bon ben up, je me suis pris une jolie alim de 650w en spare (une corsair modulaire), et j'ai exactelement le même problème :(
je suspecte du coup la carte-mère, mais après inspection, rien n'est défectueux dessus à vue d'oeil.
Est-ce qu'il est possible que ça soit esxi qui plante ?
gizmo78
Messages : 20534
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par gizmo78 »

t'es sur de ton disque/ram/processeur??
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

les disques ont vachement merdé à moment (j'ai du réparer l'array 2 fois), ce sont deux disques de 1to en raid 1.
Pour la ram, du coup je ne l'ai pas testé, pour iori, si ça avait été la ram, ça rebooterais , je suis d'accord avec ça.
Quand au proc, non, je ne sais pas si c'est ça qui pose problème
Avatar de l’utilisateur
dsebire
Messages : 13160
Inscription : ven. 12 janv. 2018 17:44
Localisation : Loiret - entre la ville et les champs

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par dsebire »

j'avais un comportement bizare jusqu'au mercredi dernier sur mon ESXi

VM qui crashent, ESX qui se plante (rarement) mais pas d'extinction de la machine (ni de reboot)

tout le monde (y compris des certifiés VMware) m'avait dit que si il y avait un problème materiel, c'est l'hyperviseur qui se tole, et pas le reste.

donc j'ai cherché longtemps avant de trouvé que j'avais une barette de RAM HS (2 puces sur les 16 de la barette)

perso, je pense pas a un problème soft (ESX) a moins que le système soit corrompu (la ou il y a l'hyperviseur d'installé)
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

Oki, merci pour ce feedback :jap:
maintenant je suspecte deux choses :
- une des 4 barettes de RAM
- Esxi en dernier lieu.

Je me suis souvenu hier que ce problème a débuté le jour où un agent de EDF avait coupé chez moi sans prévenir pour installer leur nouveaux compteurs Linky.

Donc aujourd'hui je ne vais mettre qu'une barrette sur les 4 et alterner dès que ça plante :)
Si ça plante encore, je tenterais une réinstalle de esxi (ce qui rox c'est que le datastore n'est pas sur les mêmes DD, donc à part 10 mn de reconfiguration, c'est peanut :) )
encore merci :)
Avatar de l’utilisateur
dsebire
Messages : 13160
Inscription : ven. 12 janv. 2018 17:44
Localisation : Loiret - entre la ville et les champs

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par dsebire »

fais comme moi, ça prends 2 sec:
memtest ;)
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

bon petite update, j'ai pu procéder par élimination. Mais le symptôme s'est reproduit :) alors j'ai testé chaque DD indépendamment en cassant le raid. en ne branchant que le 1er disque, le datastore était vide.
En branchant le 2e, le datastore était ok. C'est dont le disque 1 du raid qui merde.
Là j'ai les 4 barettes de RAM de branchées avec le disque 2, et pour le moment ça tourne.
Je vais formatter le DD depuis un autre poste, voir si tout va bien. Si ça passe je peux réintégrer ce DD dans le raid, ou mieux vaut-il que je prenne un autre DD ?
Avatar de l’utilisateur
dsebire
Messages : 13160
Inscription : ven. 12 janv. 2018 17:44
Localisation : Loiret - entre la ville et les champs

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par dsebire »

formattage bas niveau tant que possible + un check avec l'utilitaire du fabriquant si il existe.

si ok, tu le remets dans ton RAID et reteste.

pendant ce temps la, si ça a pas planté sur l'ESX sans le disque qui semble HS, c'est que le pb viens de la.
si ça replante en le reintégrant, poubelle
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

bon ben up en fait, j'ai le même problème :lol:
quand j'ai lancé le démarrage de la 4e VM, ça a planté.
Je vais lancé memtest avec les 4 barettes et puis on verra bien
pfiou, say nul tout ça :o
Kronick
Messages : 3372
Inscription : ven. 12 janv. 2018 17:44

Problème d\'alim ? : tour qui s\'éteint toute seule

Message par Kronick »

bon et bien j'ai retiré la carte mère que j'ai inspecté, j'ai trouvé 4 condensateurs bombés dont deux avec une trace noire au centre...
je pense qu'ils sont morts :
Image
Image

carte-mère hs ?
merci :)
Répondre