SMPFR

Si vous vous en souvenez, il m'arrive de participer à des projets de calculs distribués.
Depuis 30 ans je donne parfois de la puissance de calcul pour des projets chez Distributed.net.
Si les projets "Optimal Golomb Rules (OGR)" ne durent que quelques années, les projets à vocations cryptographiques comme RC5 peuvent durer des décennies.
Actuellement c'est le projet RC5-72 qui tourne et franchement il n'avance pas malgré un accroissement phénoménal de la puissance de calcul, d'abord des CPU puis majoritairement des GPU. https://stats.distributed.net/projects.php?project_id=8
Je ne participe pas activement mais le client de calcul distribué est un standard de bench pour moi, en testant une plateforme, un cpu ou un gpu je sais où me situer en voyant les résultats.

Aujourd'hui je suis TRÈS étonné par des résultats sur un GPU.

Je faisais tourner une Nvidia GTX 1660 Ti (1536 coeurs Cuda, PCIe 3 x16) https://www.techpowerup.com/gpu-specs/g ... 0-ti.c3364
sur plusieurs plateformes PCIe 3 minimum et sous Windows 10/11.

Les prérequis sont alors, en plus de l'architecture PCIe 3 et de l'OS , le client de calcul qui exploite alors Cuda à travers des librairies.
Chez Nvidia la version actuelle de Cuda est la version 12.x (ha bah non, 13 au moment où j'écris https://developer.nvidia.com/cuda-toolkit)

les librairies Cuda sont fournies avec les clients, rien à installer, juste paramétrer l'exécutable.
Sous Windows :

: Cuda_win.JPG (28.98 Kio) Consulté 256 fois

Et voici le résultat au bout de plusieurs heures de fonctionnement :

: kr_cuda_win.JPG (53.07 Kio) Consulté 256 fois

-> 3611 Mkeys/s

A titre de comparaison, une RTX 4060 (3072 cc / PCIe 4 x8) tourne à 5900 Mkeys/s et une RTX 3070 Ti (6144 cc PCIe 4 x16) à 7200 quand une GTX 1050 Ti tourne au mieux à 1250.

J'ai souvent eu du mal à installer Cuda sous Linux (Ubuntu), en fait non, à faire dialoguer le client Distributed.net avec Cuda.

La GTX 1660 Ti tourne au minimum avec Cuda 7.5, j'installe le 12.x, la librairie client fournie est la 7.0, ça se tient

: Cuda_lnx.JPG (40.19 Kio) Consulté 252 fois

Et à ma très grande surprise, le "Key Rate" est complètement dément : 6200 Mkey/s

: kr_cuda_lnx.JPG (23.54 Kio) Consulté 252 fois

Je suis pourtant sur une plateforme PCIe 3x pas plus moderne que les clients qui fonctionnaient sous Windows.

Les performances de la carte passent de 3600 à 6200 (+72%) ?!

je fais le test avec une GTX 1050 Ti, je passe de 1150 sous Windows à 1650 sous Linux (+43%)

Je retourne sous Windows, je regarde ce que dit la librairie.
Elle est loin d'être jeune en effet, mais est-ce elle la cause du manque de performances sous Windows ?

: Cuda_lib_win.jpg (64.61 Kio) Consulté 247 fois

Avec Biour nous avions testé des LLM / IA génératives locales chacun de notre côté, sous Windows.
Si javais le temps, je testerai bien sous Linux (pour peu qu'il existe des kits tout en main) et ensuite comparer les performances entre plateformes.

ollama ou llama.cpp si tu veux tester du tout fait

c'est noté.

http://www.boris-tassou.fr/p/2e64ab5b-b ... tatus=free

mes pérégrinations la dessus

superbe, merci pour ce tuto.
me resterai à trouver l'équivalent Win pour pouvoir comparer.

SMPFR

Cuda, différences de perfomances entre plateformes.

Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.

Re: Cuda, différences de perfomances entre plateformes.