Cuda, différences de perfomances entre plateformes.
Publié : lun. 20 oct. 2025 08:02
Si vous vous en souvenez, il m'arrive de participer à des projets de calculs distribués.
Depuis 30 ans je donne parfois de la puissance de calcul pour des projets chez Distributed.net.
Si les projets "Optimal Golomb Rules (OGR)" ne durent que quelques années, les projets à vocations cryptographiques comme RC5 peuvent durer des décennies.
Actuellement c'est le projet RC5-72 qui tourne et franchement il n'avance pas malgré un accroissement phénoménal de la puissance de calcul, d'abord des CPU puis majoritairement des GPU. https://stats.distributed.net/projects.php?project_id=8
Je ne participe pas activement mais le client de calcul distribué est un standard de bench pour moi, en testant une plateforme, un cpu ou un gpu je sais où me situer en voyant les résultats.
Aujourd'hui je suis TRÈS étonné par des résultats sur un GPU.
Je faisais tourner une Nvidia GTX 1660 Ti (1536 coeurs Cuda, PCIe 3 x16) https://www.techpowerup.com/gpu-specs/g ... 0-ti.c3364
sur plusieurs plateformes PCIe 3 minimum et sous Windows 10/11.
Les prérequis sont alors, en plus de l'architecture PCIe 3 et de l'OS , le client de calcul qui exploite alors Cuda à travers des librairies.
Chez Nvidia la version actuelle de Cuda est la version 12.x (ha bah non, 13 au moment où j'écris https://developer.nvidia.com/cuda-toolkit)
les librairies Cuda sont fournies avec les clients, rien à installer, juste paramétrer l'exécutable.
Sous Windows : Et voici le résultat au bout de plusieurs heures de fonctionnement : -> 3611 Mkeys/s
A titre de comparaison, une RTX 4060 (3072 cc / PCIe 4 x8) tourne à 5900 Mkeys/s et une RTX 3070 Ti (6144 cc PCIe 4 x16) à 7200 quand une GTX 1050 Ti tourne au mieux à 1250.
Depuis 30 ans je donne parfois de la puissance de calcul pour des projets chez Distributed.net.
Si les projets "Optimal Golomb Rules (OGR)" ne durent que quelques années, les projets à vocations cryptographiques comme RC5 peuvent durer des décennies.
Actuellement c'est le projet RC5-72 qui tourne et franchement il n'avance pas malgré un accroissement phénoménal de la puissance de calcul, d'abord des CPU puis majoritairement des GPU. https://stats.distributed.net/projects.php?project_id=8
Je ne participe pas activement mais le client de calcul distribué est un standard de bench pour moi, en testant une plateforme, un cpu ou un gpu je sais où me situer en voyant les résultats.
Aujourd'hui je suis TRÈS étonné par des résultats sur un GPU.
Je faisais tourner une Nvidia GTX 1660 Ti (1536 coeurs Cuda, PCIe 3 x16) https://www.techpowerup.com/gpu-specs/g ... 0-ti.c3364
sur plusieurs plateformes PCIe 3 minimum et sous Windows 10/11.
Les prérequis sont alors, en plus de l'architecture PCIe 3 et de l'OS , le client de calcul qui exploite alors Cuda à travers des librairies.
Chez Nvidia la version actuelle de Cuda est la version 12.x (ha bah non, 13 au moment où j'écris https://developer.nvidia.com/cuda-toolkit)
les librairies Cuda sont fournies avec les clients, rien à installer, juste paramétrer l'exécutable.
Sous Windows : Et voici le résultat au bout de plusieurs heures de fonctionnement : -> 3611 Mkeys/s
A titre de comparaison, une RTX 4060 (3072 cc / PCIe 4 x8) tourne à 5900 Mkeys/s et une RTX 3070 Ti (6144 cc PCIe 4 x16) à 7200 quand une GTX 1050 Ti tourne au mieux à 1250.