Tegra X1 - un coup d'oeil de plus près "la superchip" de Nvidia

Tegra_X1_Die

Une des premières annonces sur CES 2015 a été Nvidia'S New Tegra SoC X1, le successeur du géant des graphiques à son assez bonne Tegra K1. Doté de la dernière centrale ARM Cortex-A57 et A53 CPU combo et la technologie GPU de Nvidia Maxwell, première 20nm la SoC de la société semble être aussi efficace que l'énergie, il est puissant. Nous allons plonger un peu plus dans ce que le Nvidia Tegra X1 a à offrir.

CPU

La première chose que vous avez probablement remarqué sur le X1 Tegra est que Nvidia semble avoir abandonné sa personnalisé architecture 64-bit Denver CPU, que l'on trouve dans le Nexus Tegra K1 de 9, et est retourné à un ARM 64 bits plus standard configuration. Cela ne veut pas dire cette puce est pas intéressant, Nvidia sera parmi les premiers à mettre un Cortex A57 OCTA-core et A53 SoC, disposés en deux groupes de quatre, sur le marché. Cette conception est similaire à Qualcomm à venir Snapdragon 810 et Samsung existante Exynos 5433.

Tegra spécifications x1

Il ya un couple de raisons pour lesquelles Nvidia peut avoir choisi de revenir aux conceptions ARM. Nvidia a déclaré que lui-même marché time-to-est le leader raison, ce qui suggère que la diminution de sa conception de CPU Denver jusqu'à 20nm était plus de temps que ramasser et de les retravailler un design ARM. Sinon, peut-être Nvidia n'a pas été convaincu par les résultats de la performance de son CPU de coutume, mais il a laissé entendre que Denver peut réapparaître dans un futur SoC. Peu importe, nous allons jeter un oeil à ce que Nvidia a fait avec les conceptions de référence de ARM.

Tegra X1 mise en page

L'A57 cluster CPU haut de gamme dispose de 2 Mo de cache L2 partagé entre les quatre cœurs, avec 48KB L1 instruction et de caches de données 32KB L1. Les quatre processeurs de l'énergie efficace A53 part 512 Ko de cache L2 et possède deux caches L1 de 32 Ko pour les instructions et les données.

Comme la conception de base de plusieurs CPU suggère, la puce de Nvidia fonctionne comme une conception big.LITTLE afin de partager plus efficacement les charges de travail à travers les noyaux CPU les plus appropriées. Cependant, Nvidia a opté pour son propre interconnexion de coutume, plutôt que de CCI-400 d'ARM, et la migration de cluster, plutôt que la planification globale de la tâche, d'ouvrir tous les huit cœurs pour une utilisation à la fois.



Nvidia vante que sa conception d'interconnexion surpasse considérablement System LSI de Samsung utilisé dans les Exynos 5433, offrant 1,4 fois plus de performance pour la même quantité d'énergie ou de la moitié de la puissance nécessaire pour produire le même niveau de performance. Cette baisse est en partie à la cohérence de cache, ce qui réduit les peines de puissance / performance habituellement associés à la migration de cluster. Nvidia a également décidé d'utiliser son propre système de gestion de l'alimentation électrique de conception du système point à étrangler et la porte horloge vitesses, plutôt que ARM dans la maison- Fonctionnalité d'allocation Intelligent Power.

Bien que le X1 Tegra est retourné à un design ARM CPU, Nvidia estime clairement que ses propres personnalisations peuvent améliorer la formule de bras standard.

GPU

La nouvelle technologie fait aussi son chemin dans l'aspect GPU de dernière SoC Nvidia. Le Tegra X1 dispose à nouveau l'architecture graphique propriétaire de Nvidia, bien que cette fois le SoC est d'emballage dernière architecture Maxwell de l'entreprise, qui alimente le haut de gamme GTX 980 gamme de cartes graphiques, ainsi que la incroyablement efficace de l'énergie GTX 750Ti.

Tegra X1 référence

Prenez propres repères de Nvidia avec une pincée de sel, mais le X1 semble offrir au moins un coup de pouce supplémentaire de 50 pour cent au cours de la K1.

Tegra X1 Maxwell GPU

Nvidia affirme avoir doublé les performances du GPU et réduit de moitié les besoins en énergie de la puce par rapport à la Tegra K1. Les indices de référence Nvidia suggèrent que cette efficacité énergétique a été labouré vers l'arrière dans l'augmentation des performances, ce qui signifie que le processeur graphique du X1 est encore susceptible d'être très gourmand en énergie. Tout comme le Tegra K1, le X1 est probablement destiné pour les produits de la tablette, où les fabricants peuvent se faufiler dans une certaine capacité de batterie supplémentaire.

La conception du GPU a un peu changé par rapport avec la dernière génération, avec deux Maxwell SMM (Streaming multiprocesseurs) pour un total de 256 cœurs CUDA, comparativement à un seul Kelper SMX et 192 cœurs CUDA dans le Tegra K1. Bien que le nombre de cœurs CUDA peut ne pas avoir doublé, Nvidia indique qu'un Maxwell SMM est jusqu'à 40 pour cent plus efficace qu'un aîné Kepler SMX. En outre, le passage à deux complète SMM signifie que la géométrie et textures importantes unités ont été doublées.



Nvidia a également quadruplé le nombre de ROP à 16 et a ajouté un cache L2 de 256 Ko entre les ROPs et l'interface mémoire 64 bits, ce qui devrait aider le GPU conduire ces écrans de plus haute résolution. Des améliorations générales de mémoire seront également jouer un grand rôle dans la performance du Tegra X1 saute sur des résolutions plus élevées, comme cela est généralement un domaine dans lequel les appareils mobiles souffrent de goulots d'étranglement.

Parlant de la mémoire, Nvidia a également mis en place un fonctionnalités nouvelles et améliorées de compression de mémoire dans le X1 Tegra, à atténuer de nouvelles exigences de bande passante sur les DRAM 64 bits de bus de mémoire de la puce. Le GPU continue à soutenir une gamme de OpenGL 4.x et DirectX 11.x fonctionnalités, y compris la tessellation, Ressources carrelée et Voxel illumination globale, garantissant que les clients mobiles Nvidia peuvent faire la plupart des derniers effets de jeu et de l'efficacité.

Tegra X1 vs Tegra K1

Une dernière caractéristique importante ajoutée à la X1 Tegra est un soutien pour "la double vitesse FP16" (Les opérations en virgule flottante 16 bits) dans les noyaux CUDA du GPU. Typiquement Maxwell ne présente FP32 et FP64 noyaux, mais Nvidia a modifié la gestion de l'opération FP16 dans le X1, dans lequel un ensemble limité d'opérations FP16 peut être emballé et calculé sur une base de FP32 simple. Cela ne veut pas idéal, mais permettra à Nvidia de rivaliser avec ses concurrents dans des situations où les opérations FP16 sont importants. Globalement, ces changements ajoutent jusqu'à 1024 Gflops (1) TFLOP performances FP16 et 512 Gflops pour les opérations FP32.

Feature Set

Nvidia n'a pas seulement allé tous azimuts avec son CPU et la conception de GPU. Lier l'ensemble SoC ensemble est une grande interface mémoire LPDDR4 64 bits qui prend en charge jusqu'à 4 Go de RAM. Bande passante mémoire de pointe a été renforcée jusqu'à 25,6 Go / s, contre 14.9GB / s et l'efficacité énergétique est améliorée de près de 40 pour cent. Le Tegra X1 supporte maintenant eMMC 5.1 mémoire pour une lecture plus rapide et écriture de cartes de stockage à haute vitesse.

Tegra X1 Architecture mémoire

Vidéo et le soutien d'affichage a également été heurté cette génération. Le X1 Tegra soutient 60fps 4K H.265, H.264, vp9 et VP8 encodage vidéo et le décodage, l'amélioration sur les 30fps 4K limite de la Tegra K1. Écrans externes sont également pris en charge à 60fps pour 4K contenu vidéo via HDMI 2.0 et HDCP 2.2 connexions. JPEG coder et décoder a également reçu un boost de vitesse quintuplé, passant de 120 MP / s à 600 MP / s, bien que les autres caractéristiques de FAI apparaissent le même que le Tegra K1. Le Dual ISP soutient 4096 points de discussion, 100 capteurs MP et jusqu'à 6 entrées caméra.

Résumer

Le Tegra X1 est une nette amélioration par rapport à son prédécesseur et devrait fournir un saut considérable dans les performances du GPU. Comme Qualcomm, Samsung et MediaTek se déplacent tous vers de nouveaux modèles de CPU ARM Cortex cette année, Nvidia mise sur ses prouesses graphiques pour se distinguer de la concurrence. Nous devrons attendre pour obtenir nos mains sur la puce de savoir avec certitude si le X1 Tegra a ce qu'il faut pour contester plus grands acteurs du marché mobile, mais dernier effort de Nvidia ressemble certainement un concurrent sérieux cette année.




» » » Tegra X1 - un coup d'oeil de plus près "la superchip" de Nvidia