Bon le coup d'avoir des overrun sur du gigabit, à moins de se trainer un p4, de réduire l'interrupt coalescing au minimum et de tunner les buffer kernel au minimum, c'est plus vraiment un problème.Pas du tout !
BIG recommandation pour des serveurs de production vidéo, partagés en CIFS/Samba/AFP via Gigabit :
+ rester en MTU 1500 gros max sinon maxi latence !!
ping
Sauf bien sur si ton cpu passe plus de temps a process quelque chose d'autre que de répondre au IRQ de la carte réseau.
Le flow control c'est moyennent utile si ton client et server sont sur le même switch, mais dès que t'as plusieurs switch le flow control 802.3x sert plus à rien puisque les pauses frames sont pas transmises plus haut dans la chaine de transit. Du coup au lieu de discard la ou ça bottleneck tu discard dans le milieu du réseau.
C'est partiellement résolu avec le Priority flow control et les switch qui supporte le DCBX mais c'est uber pénible a config (basé sur des flows que tu map sur une class of service) et si t'as qu'un seul flow qui te bouffe ta BP ... ça change rien.
En plus avoir le flow control TX enabled sur un switch c'est 99% garantie de créer un head of line blocking vu que le switch va non seulement pause le lien qui le demande mais aussi tout les liens qui essaient de parler avec celui la.
Résultat, puisque t'as un lien qui souffre tu te retrouve avec tout ton switch qui pause le traffic.
Ensuite; les pause frames en elle même, c'est bien si t'as des burst de data et que tu veux juste les absorbés, si ton lien est toujours a 100% ou proche, tu va envoyé des pause frame en quasi continue.
Résultat, tu va ralentir la réception de certain paquet,utiliser tout ton buffer sur le switch ... au point que ça risque de discard sur le switch, et la TCP il va pas aimer, donc on part en retransmit avec une fenêtre de congestion réduite == grosse latence à cause du retransmit + débit ralentit puisque cwnd réduite .
La vrai solution, carte réseau avec de gros ring buffer hardware et switch avec de gros buffer, ou passer sur un lien de plus gros calibre qui sera sous utilisé.
Pour la MTU, si ça t'introduit de la latence de passer sur des jumbo, c'est que t'as un problème avec l'interrupt coalescing qui est pas tuner correctement.
Source : je viens de passer deux mois à résoudre ce problème sur du 10GB et 40GB avec des switchs Mellanox, Force10 et Arista.
pong