Un examen plus attentif de la technologie graphique ARM Mali

ARM Mali-T880

Les smartphones et les tablettes haut de gamme d'aujourd'hui repoussent les limites de petit facteur de forme des unités de traitement graphique (GPU), bénéficiant console graphiques de qualité à des résolutions d'affichage supérieures à la plupart des téléviseurs salon chambre. Mais il n'y a pas que l'espace mobile haut de gamme qui nécessite un matériel graphique dédiée ces jours. Des marchés en croissance pour smartwatches et boîtes Smart-TV compacts également faire usage des GPU. L'un des GPU mobiles les plus répandus est comprise Mali d'ARM, et nous avons eu la chance d'être donné un coup d'oeil de plus près les plans futurs pour la gamme de GPU Mali à Tech Day 2015 semaines dernière d'ARM.

Plus récemment, ARM a annoncé son énergie efficace Mali-T880 et T860 pour les appareils mobiles haut de gamme, et son T820 et T830 dessins pour les implémentations de coût-efficacité. Le T880 dispose de 1,8 fois la performance de pointe de sa conception Mali-T760, avec une réduction de 40 pour cent de l'énergie pour les mêmes charges de travail et le soutien à ultra-haute résolution 4K contenu.

ARM n'a pas exclu une conception Mali-450 pour dispositifs portables de faible puissance soit modifié, si les équipementiers exigent.

À l'extrémité inférieure, qui est généralement lié par les coûts de silicium, le T830 et T820 visent à réduire la taille de la zone filière par jusqu'à 50 pour cent au cours de la T622, offrent d'échelle pour une variété d'applications, et encore en charge jusqu'à à jour graphiques et API calcul, telles que OpenGL ES 3.1 et Direct X de Microsoft 11.1. En fait, le Mali-T820 est maintenant le plus petit OpenGL ES 3.0 conception conforme que ARM a.

ARM Mali GPU feuille de routeMalgré l'introduction de nouveaux modèles de GPU, les puces traditionnelles comme le Mali-450 sont encore bien adapté aux applications exigeant moins de performance tels que wearables. Avec le soutien bien établi, cette conception pourrait rester pour un certain temps. ARM n'a pas exclu une conception Mali-450 pour dispositifs portables de faible puissance soit modifié, si les équipementiers exigent.

Aperçu Midgard architecture

Dernières créations de ARM sont encore tous construits sur son architecture Midgard Tri-pipe, qui abritent la plupart, mais pas tous les composants GPU clés à l'intérieur du «noyau de shader", permettant de mise à l'échelle de la performance simplement en ajustant le nombre de cœurs. La plupart des autres modèles de GPU ne pas adopter des conceptions quelle échelle de cette façon, mais cela permet à ARM de cibler un éventail d'utilisations cas avec des dessins assez similaires.



Mali_Shader_Core

Au haut de gamme, le Mali-T860 dispose 3 ALUs par shader core, par rapport au T860 et T760 2 ALUs de par cœur, avec les Load / Store et de texture unités. Cette ALU supplémentaire offre jusqu'à une amélioration de 50 pour cent en puissance de calcul par cœur. Les deux modèles de T880 et T860 peuvent être élargis du simple au 16 implémentations de base cohérentes, en fonction du niveau de performance requis par le GPU.

Avec mobile, les plus grands facteurs limitatifs à la performance et la puissance proviennent de la mémoire. Tout simplement, la bande passante disponible est beaucoup plus faible que la console ou graphiques de bureau équivalents, ce qui signifie que la performance peut être un goulot d'étranglement par la mémoire. Pour surmonter ce problème, ARM fait usage de ASTC, AFBC, Composition intelligente et techniques Transaction élimination, optimise son architecture pour les charges communes telles que les tâches de l'interface utilisateur, et tente de réduire le nombre de transactions de mémoire en envoyant des informations de meilleure qualité. Voilà aussi pourquoi ARM met en œuvre carreaux rendu basé, comme la tuile active de la trame est conservée dans la mémoire locale aussi longtemps que possible, plutôt que d'être poussé à la mémoire principale plus lent.

Jargon Buster:

  • ALU - Unités arithmétiques et logiques sont des circuits numériques utilisés pour effectuer des mathématiques et de la logique entier bit à bit.
  • Carrelé Rendu - rompt une scène vers le bas dans les petits carreaux, qui peuvent ensuite être rendus séparément à la mémoire sur puce.
  • Transaction élimination - Réduit le traitement en sautant les tuiles en double de la trame précédente.
  • AFBC - ARM tampon de trame de compression permet d'économiser de la bande passante de la mémoire en stockant une image en utilisant la compression sans perte.

Non seulement cela, mais l'écriture et de la lecture constante de la mémoire est une tâche coûteuse d'énergie, consommant quelque part autour de 100 mW de puissance pour 1 Gbps de bande passante avec LPDDR4. Au lieu de cela, ARM suggère que les fabricants de silicium dépenser un peu plus d'espace sur la mémoire cache pour réduire la consommation d'énergie et aider à garder autant de données que possible sur le GPU.

Complete GPU Mali

La plupart des autres modèles de GPU ne pas à l'échelle de cette façon, mais cela permet à ARM de cibler un éventail d'utilisations cas

Parlant de pouvoir, ARM a également fait beaucoup de travail pour optimiser ses derniers processeurs graphiques pour l'efficacité énergétique tout en effectuant les tâches les plus courantes. La plupart de ces relèvent poussant pixels autour comme l'utilisateur se déplace à travers l'interface utilisateur, qui, croyez-le ou non, nécessite un traitement graphique. Ces transitions homescreen lisses ne sont pas libres.

Le T830 d'extrémité inférieure et T820 héritent beaucoup de ces caractéristiques haut de gamme, mais les pipelines avec unités scalaires ont été retirés de l'ALU. Le T830 dispose ALU 2 par cœur, alors que le T820 dispose d'un seul, et peut à la fois être étendu à 4 shaders GPU de base.

Performances ARM Mali-T880

Tout comme la nouvelle ARM Cortex-A72 CPU, la dernière itération du Mali est clairement axé sur l'efficacité énergétique et à extraire plus de performance tout en collant au pouvoir serrés et des contraintes thermiques de plates-formes mobiles. En réduisant les besoins en mémoire et de puissance, les partenaires de silicium devraient être libres d'emballer dans des carottes de GPU supplémentaires et ainsi augmenter les performances au fil des générations précédentes.

L'avenir du Mali

Parlant de la puissance, le passage à des processus de FinFET de 16nm est également sûr d'entraîner des gains décents pour les modèles de GPU. Avec une consommation de puissance et de tailles de conception à la fois de diminuer, les partenaires de silicium haut de gamme ARM pourront presser shader cores supplémentaires dans leurs conceptions SoC, comme nous l'avons déjà vu avec huit Mali-T760 core 14nm de Samsung Exynos 7420. Sur le marché à moindre coût, les GPU plus petites empreintes pourrait soit être utilisé pour augmenter le nombre de noyau ou économiser sur les coûts de silicium de plus en plus coûteux.

Nous avons déjà également porté sur la nécessité pour la bande passante de la mémoire supplémentaire pour des caméras haute résolution et affiche, mais cette largeur de bande supplémentaire et la consommation d'énergie associée pourrait être une grande ponction sur nos batteries. Les techniques d'économie de mémoire ARM et optimisations générales pourraient aussi verser des dividendes que les marchés mobiles poussent vers encore plus de contenu de la résolution.

Avec ARM offrant des forfaits complets POP-IP déjà conçus pour la fabrication 16nm FinFET, nous pourrions bien voir quelques SoC basée au Mali, plus efficaces et plus puissants énergie a frappé le marché vers la fin de l'année 2016.




» » » Un examen plus attentif de la technologie graphique ARM Mali