News - [PROCESSEUR] AMD Strix Point SoC réintroduit le processeur Dual-CCX, d'autres détails intéressants sur le silicium révélés

EVIL66

Super Modo OCPC
Membre du Staff
amd_logo.png

AMD Strix Point SoC réintroduit le processeur Dual-CCX, d'autres détails intéressants sur le silicium révélés

Depuis sa révélation la semaine dernière, AMD nous a présenté ses deux prochains processeurs de manière un peu plus technique : le silicium « Strix Point » qui équipe ses processeurs mobiles de la série Ryzen AI 300 et le chipset MCM « Granite Ridge » qui équipe ses processeurs de bureau Ryzen 9000. Nous présentons un aperçu plus détaillé du SoC « Strix Point » dans cet article. Il s'avère que « Strix Point » adopte une approche sensiblement différente du multicœur hétérogène que « Phoenix 2 ». AMD nous a donné un aperçu détaillé de son fonctionnement. AMD a construit le silicium monolithique « Strix Point » sur le nœud de fonderie TSMC N4P, avec une surface de puce d'environ 232 mm².

mzRgJkIVXcjkP1t198e3f8a254b08362.jpg
Le silicium « Strix Point » considère l'interconnexion Infinity Fabric de la société comme son éther omniprésent. Il s'agit d'une interconnexion point à point, contrairement au bus en anneau de certains processeurs Intel. Les principaux équipements de calcul du SoC « Strix Point » sont ses deux complexes de calcul CPU (CCX), chacun avec un chemin de données de 32 bits (lecture)/16 bits (écriture) par cycle vers la structure. Le concept de CCX fait son retour avec « Strix Point » après presque deux générations de « Zen ». Le premier CCX contient les quatre cœurs CPU « Zen 5 » de taille normale de la puce, qui partagent entre eux un cache L3 de 16 Mo. Le deuxième CCX contient les huit cœurs « Zen 5c » de la puce qui partagent un cache L3 plus petit de 8 Mo. Chacun des 12 cœurs dispose d'un cache L2 dédié de 1 Mo.

xrTKG1sPVayTnBZU181491baff517ee0.jpg

Cette approche du multicœur hétérogène est sensiblement différente de celle de « Phoenix 2 », où les deux cœurs « Zen 4 » et les quatre cœurs « Zen 4c » faisaient partie d'un CCX commun, avec un cache L3 commun de 16 Mo accessible aux six cœurs.Les cœurs « Zen 5 » sur « Strix Point » pourront supporter des fréquences de boost élevées, supérieures à 5,00 GHz, et devraient bénéficier du cache L3 plus important de 16 Mo partagé entre seulement quatre cœurs (cache L3 similaire par cœur à « Granite Ridge »). Les cœurs « Zen 5c », en revanche, fonctionnent à des fréquences de base et de boost inférieures à celles des cœurs « Zen 5 », et disposent de quantités de caches L3 disponibles inférieures. Pour que les threads puissent migrer entre les deux types de cœurs, ils devront passer par la structure et, dans certains cas, même subir un aller-retour vers la mémoire principale.

3Laqt4FwdY1BNrdX7e39cbe729d29346.jpg

Les cœurs « Zen 5 » de « Strix Point » pourront supporter des fréquences de boost élevées, supérieures à 5,00 GHz, et devraient bénéficier du cache L3 plus important de 16 Mo partagé entre seulement quatre cœurs (cache L3 semblable par cœur à « Granite Ridge »). Les cœurs « Zen 5c », en revanche, fonctionnent à des fréquences de base et de boost inférieures à celles des cœurs « Zen 5 » et disposent de moins de caches L3 disponibles. Pour que les threads puissent migrer entre les deux types de cœur, ils devront passer par la structure et, dans certains cas, même faire un aller-retour vers la mémoire principale.

Le cœur Zen 5c est environ 25 % plus petit en termes de surface de puce que le cœur Zen 5. Pour référence, le cœur Zen 4c est environ 35 % plus petit qu'un cœur Zen 4 classique. AMD a travaillé pour améliorer légèrement les fréquences de boost maximales du cœur Zen 5c par rapport à son prédécesseur, de sorte que la bande de fréquence des cœurs Zen 5c est un tout petit peu plus proche. Les tensions maximales plus faibles et les fréquences de boost maximales des cœurs Zen 5c leur confèrent un avantage significatif en termes d'efficacité énergétique par rapport aux cœurs Zen 5. AMD continue de s'appuyer sur une solution de planification basée sur un logiciel qui garantit que le bon type de charge de travail de traitement est affecté au bon type de cœur. La société affirme que la solution logicielle lui permet de corriger les « erreurs de planification » au fil du temps.

L'iGPU est le périphérique le plus gourmand en bande passante de la structure et obtient son chemin de données le plus large : 4 x 32 B/cycle. Basé sur l'architecture graphique RDNA 3.5, qui conserve le moteur SIMD et l'IPC de RDNA 3, mais avec plusieurs améliorations des performances/Watt, cet iGPU dispose également de huit processeurs de groupe de travail (WGP), contre 6 sur le silicium « Phoenix » actuel. Cela équivaut à 16 CU, ou 1 024 processeurs de flux. L'iGPU dispose aussi de 4 backends de rendu+, ce qui équivaut à 16 ROP.

Le troisième périphérique le plus gourmand en bande passante est le NPU XDNA 2, avec un chemin de données de 32 B/cycle dont la bande passante est comparable à celle d'un CCX. Le NPU comprend quatre blocs de 8 matrices XDNA 2 et 32 tuiles de moteur d'IA ; pour 50 TOPS de débit d'inférence d'IA, et peut-être overclocké. Il prend aussi en charge le format de données Block FP16 (à ne pas confondre avec bfloat16), qui offre la précision du FP16, avec les performances du FP8.

Outre les trois composants logiques lourds, il existe d'autres accélérateurs assez exigeants en bande passante, tels que le moteur Video CoreNext qui accélère l'encodage et le décodage ; le coprocesseur audio qui traite la pile audio lorsque le système est « hors tension », afin qu'il puisse répondre aux commandes vocales ; le contrôleur d'affichage qui gère les E/S d'affichage, y compris la compression du flux d'affichage, si nécessaire ; le SMU, Microsoft Pluton, TPM et d'autres matériels de gestion.

Les interfaces E/S du SoC « Strix Point » incluent un contrôleur de mémoire qui prend en charge les LPDDR5 128 bits, LPDDR5x et DDR5 double canal (160 bits). Le complexe racine PCI-Express est légèrement tronqué par rapport à celui fourni avec « Phoenix ». Il y a un total de 16 voies PCIe Gen 4. Les 16 voies devraient être utilisables dans les ordinateurs portables dépourvus de chipset FCH discret, mais le nombre de voies utilisables devrait tomber à 12 lorsque AMD adaptera finalement ce silicium au Socket AM5 pour les APU de bureau. Sur les ordinateurs portables de jeu qui utilisent des processeurs Ryzen AI HX ou H 300, les GPU discrets doivent avoir une connexion Gen 4 x8. La connectivité USB comprend un USB4 40 Gbps, ou deux USB 3.2 Gen 2x2 20 Gbps, deux USB 3.2 Gen 2 10 Gbps supplémentaires et trois USB 2.0 classiques.
 
Retour
Haut