Comment big.Little A53 / A57 puces seront mis à la honte de la S4 Pro, Tegra 4, et Exynos 5 Octa

CPU retraités Crédit: Wikipedia

Nous avons eu récemment un oeil à la place à venir Exynos 5 Octa, et dissipé certains des mythes au sujet de processeurs octo-core. Mais certains d'entre vous dans les commentaires ont été peering encore plus loin dans l'avenir, et a soulevé la question intéressante de la combinaison big.LITTLE A53 / A57. Donc, nous allons jeter un oeil à ce qui est en magasin dans la prochaine génération de puces ARM, et comment ils se comparent contre le sommet actuel des processeurs de ligne.

big.LITTLE

Temps pour big.LITTLE la conception de processeur d'un ARM recapture rapide est une solution élégante à la prise irritante 22 qui se produit lorsque les fabricants veulent augmenter la puissance de traitement, mais sont limités par la taille de la batterie.

big.LITTLE fonctionne en ayant deux ensembles de processeurs, un groupe de faible puissance pour les activités générales et un ensemble de haute performance pour les jeux et d'autres applications de traitement de taxation. Les tâches sont ensuite affectés à ces processeurs en fonction de la demande, permettant d'importantes économies d'énergie alors que seule une petite quantité de puissance de traitement est nécessaire, sans compromettre les performances de pointe.

ARM bigLITTLE Crédit: ARM

Exynos 5 Octa de Samsung est la première puce de contourner la question du pouvoir en utilisant la conception big.LITTLE, en utilisant un ensemble de faible puissance ARM quad-core A7s et un ensemble de plus puissants A15s. Mais AMD a annoncé qu'il va produire la prochaine itération de cette idée, en utilisant un processeur Cortex A57 encore plus puissant que le noyau de plomb, et un ensemble de Cortex A53s faire des économies sur la consommation d'énergie.

A53

L'A53 est renforcé version de l'A7, offrant des performances similaires à l'Cortex A9 mais en utilisant jusqu'à 40% moins d'énergie. La prochaine génération de puces ARM inclut également le support pour les applications 64 bits et sera produite sur la taille de la matrice de 20 nm, éventuellement être rendue aussi petite que 14nm. Donc, ainsi que des améliorations de performance et de consommation d'énergie, les nouvelles puces offriront également des optimisations de chaleur et de code.

La chose impressionnante sur l'A53 est que la performance des processeurs de pointe devrait être quelque part autour de celle du processeur quad-core A9 dans le Galaxy S3. Personne ne se plaignait que le Galaxy S3 est lent, et 40% moins d'énergie attirer votre combiné ne sera pas besoin d'être rechargé loin d'être aussi souvent.

Ce qui rend l'A7 et A53 consomment moins d'énergie par rapport à leurs puces haut de gamme équivalente est dû au fait qu'ils utilisent l'exécution dans l'ordre, de sorte que les processus ne peuvent être accomplies dans l'ordre où ils sont reçus. Ceci est économe en énergie, mais réduit les performances pour des tâches multi-thread par rapport à sortir de l'exécution des ordres - qui permet aux processeurs pour accélérer le traitement en réorganisant les instructions.

A57

Voilà où la nouvelle A57 entre en jeu. Le haut de gamme Cortex A57 est un processeur 64-bit out-of-order exécution, ce qui offre un gain de performances notable sur l'A15 déjà puissante, mais encore une fois parvient à améliorer l'efficacité énergétique. Les améliorations ajoutent à un 20 - augmentation de 30% de la performance sur la puce plus âgé, donc dès le départ cette nouvelle mise en œuvre de big.LITTLE sera possède une performance de pointe supérieure à l'ancienne génération.

Cortex A50 série Crédit: ARM

32 vs 64 bits

Comme mentionné, à la fois l'A53 et l'A75 introduisent soutien des applications 64 bits pour les appareils Android. Bien que probablement destiné au marché haut de gamme de l'ordinateur serveur, il pourrait y avoir certains avantages pour les utilisateurs d'appareils portables Android était si jamais de passer à un système d'exploitation 64 bits.

Le nombre de bits, quand on parle de processeurs CPU, se réfère à la largeur du registre du processeur. En d'autres termes, comment la valeur des données de de beaucoup de particuliers 1 et 0 le processeur peut tirer d'autres sources pour stocker quand il a besoin de faire un travail.

Si vous voulez entrer dans les aspects techniques de cette, la limite totale de la mémoire sur un processeur 32 bits est calculée par 2 ^ 32, qui fonctionne à une peine maximale de 4 Go de mémoire accessible. Toutefois, lorsque vous prenez mémoire requise par le matériel du système et de la mémoire graphique, les systèmes 32 bits sont souvent laissés avec moins de 4 Go laissé disponible pour les applications.



Processeurs 64 bits d'autre part peuvent lire à partir d'un massif 2 ^ 64 la valeur de la mémoire, ce qui correspond à une valeur de 16 exaoctets - ou 16 milliards de gigaoctets.

Mais pourquoi tout cela est-important, il est pas comme les smartphones et les comprimés sont actuelles particulièrement lente? Eh bien, les avantages proviennent de ce fait que la RAM est beaucoup plus rapide à lire et écrire des données que les dispositifs de stockage sur disque. Donc, si vous augmentez la quantité maximale disponible de RAM, vous pouvez passer moins de temps d'attente pour les données à transférer à partir de périphériques de stockage plus lents, et d'améliorer votre performance globale du système.

64 bit applications codées peuvent également être plus rapide à exécuter que 32 ceux de bits, que vous pouvez envoyer plus de données au processeur en une seule fois si vous êtes en utilisant le registre de CPU plus large. Les applications peuvent être plus rapide et plus efficace avec un processeur 64 bits, et les comprimés seront enfin en mesure de pousser au-dessus de la RAM 4 Go marque.

Performance vs Batterie

ARM a défini deux itinéraires spécifiques qu'il veut prendre quand il vient aux appareils mobiles. Pour les smartphones, il envisage une combinaison de dual et quad core, avec deux cœurs Cortex A57 fournissant la puissance en cas de besoin, et quatre A53s Cortex disponibles pour le traitement général. Implémentations Tablet mettra en vedette deux jeux de quad-cores, pour une certaine puissance de traitement supplémentaire.

Cortex A50 configurations mobiles Crédit: ARM

Pour en revenir à deux smartphones de base de puces quad core Exynos 5 comme l'Octa, Tegra 4, et S4 Pro peut sembler pas en arrière, mais il ya plusieurs considérations de conception intelligentes qui rendent ce un choix intelligent.

Tout d'abord, rappelez-vous que la performance minimale de référence est considérablement améliorée au cours de l'Exynos 5 Octa. Bien qu'il y ait consommation de puissance supplémentaire tout en ralenti, l'idée est que les noyaux les plus puissants ne seront pas nécessaires à moins que vous êtes jeu ou faire autre chose vraiment UC.

Comme il ya déjà beaucoup de puissance de traitement des quatre A53s, il fait beaucoup de sens pour seulement ajouter un supplément de deux noyaux de haute performance, pour empêcher la fuite d'énergie inutile de quatre cœurs qui ne sont jamais susceptibles d'être utilisés pleinement.

Cortex A50 tableau de performance Crédit: ARM

Deuxièmement, big.LITTLE visent à trouver le meilleur équilibre entre performance et consommation d'énergie. Bien que l'A7 est une puce de très faible puissance, l'A15 est un assez grand drain de puissance. Compte tenu de l'A7 est tout à fait un processeur faible, il est probable que les A15s sera la mise en marche assez régulièrement, drainant le jus rapidement. La nouvelle A53 / A57 combinaison offre consommation moyenne inférieure, par ne pas avoir à passer sur les A57s affamés aussi souvent.

Pour les tablettes, où la hausse des écrans à résolution sont susceptibles de devenir beaucoup plus fréquents, il ya un besoin de puissance supplémentaire, d'où les deux noyaux de A57 supplémentaires ..

Empilage face à la concurrence

Je suis sûr que beaucoup d'entre vous se demandent quelle est la différence entre les techniques d'efficacité énergétique utilisées dans les goûts de Tegra 4 ou Qualcomm S4 Pro de Nvidia. Le tout se résume à des processeurs symétriques ou asymétriques.

Vous voyez, il ya deux façons d'organiser votre multi-core CPUs- ils peuvent soit travailler en étroite collaboration, le partage de la mémoire et tels, ou ils peuvent être plus autonome et le travail de leurs propres caches et être peu conscients de ce que les autres processeurs font . Il ya des avantages et des inconvénients de chaque méthode, que je vais expliquer.



Asymétrique Multi-Processing (AMP) permet pour chaque noyau d'être tourné hors individuellement et leurs tensions contrôlées en fonction des exigences de traitement. Ceci est la méthode la plus efficace d'économiser l'énergie de la batterie, mais peut avoir des ennuis lors de l'exécution l'application multi-thread, de contrôles externes sont nécessaires pour assurer que les noyaux communiquent correctement.

Quad Core Krait consulter Présentation exécutant une vidéo séparée sur chaque cœur

Crédit: Carrypad Quad Core Krait consulter Présentation exécutant une vidéo séparée sur chaque cœur

Multi-traitement symétrique (SMP), d'autre part, transfère l'attribution des tâches au système d'exploitation, ce qui est beaucoup plus pratique. Avec SMP vous pouvez contrôler la fréquence des groupes de base, mais pas noyaux individuels, ce qui est moins économe en énergie que l'AMP.

Performance sage, AMP est généralement plus rapide et plus économe en énergie au manipulation beaucoup de tâches individuelles, où comme SMP est meilleure lorsque vous exécutez plusieurs processus qui partagent le même pool de mémoire (à savoir les applications multi-thread). Alors, vraiment, il descend à des applications en cours d'exécution.

Les noyaux Krait de Qualcomm (S4 Pro) sont asymétriques, de sorte que chaque noyau peuvent être activées et désactivées individuellement pour économiser sur la consommation d'énergie. Big.LITTLE d'autre part, est un hybride de deux architectures- les ensembles de noyaux sont SMP, mais chaque groupe peut être commandée de façon asymétrique.

Les processeurs NVIDIA Tegra sont les plus bizarres de la grappe. Le noyau de compagnon peut être contrôlé individuellement et est asymétrique pour les quatre principaux noyaux. Toutefois, les principaux noyaux Tegra peuvent également être fermés individuellement par gating leur pouvoir, mais ils ne peuvent pas être synchronisés individuellement comme un vrai processeur AMP.

Mais qui est la méthode la plus efficace de conservation de l'énergie?

Malheureusement nous ne pouvons pas comparer la consommation électrique réelle de chaque puce encore, donc nous allons devoir essayer de notre mieux pour en déduire les performances de la façon dont les architectures sont conçus.

Tant les 4 utilisation ARM Cortex A15 processeurs Tegra Pro et S4, qui ont une consommation d'énergie minimum plus élevé que le Cortex A7 et A53. Dans les états d'alimentation les plus bas de la S4 Pro et Tegra 4 seront en cours d'exécution un seul A15 avec une horloge à faible, tandis que le big.LITTLE sera exécuté quatre A53s une horloge faible.

Le graphique montre que même le Cortex A7's highest performance state consumers less power than the A15's lowest performance state.

Crédit: ARM Le graphique montre que même le plus les consommateurs de l'Etat de performances moins de puissance de l'Cortex A7 à plus bas niveau de performances de l'A15.

Globalement, la puissance minimale consommée est susceptible d'être très similaire. La nature AMP de Tegra et le S4 Pro pourrait leur donner un léger avantage sur l'A53, mais pas l'A7. Cependant de dessins de Nvidia fois Qualcomm et nécessiteront la puissance cœurs affamés être allumé si plus d'un noyau est nécessaire, en ajoutant instantanément plus drain de puissance. Big.LITTLE peut exécuter 4 cœurs dans l'état de plus faible puissance, ne soit nécessaire de les vitesses d'horloge de base et la tension légèrement afin d'augmenter les performances.

L'avantage réel de big.LITTLE brille à travers lorsqu'ils traitent avec des exigences moyennes de performance. Les deux modèles concurrents de Qualcomm et Nvidia ont pour allumer leurs noyaux de haute performance, si quoi que ce soit au-dessus de la puissance minimale est requise. Où que big.LITTLE peut rester sur la plus grande puissance noyaux efficaces jusqu'à ce absolument nécessaire, résultant de la consommation de puissance moyenne inférieure.

À l'extrémité supérieure, l'introduction de la double A57s devrait également aider la nouvelle puce réduire la consommation de puissance de crête, qui devrait voir big.LITTLE battu les concurrents ici aussi.

Conclusion

Dans l'ensemble, l'architecture big.LITTLE semble offrir le meilleur équilibre entre la consommation d'énergie, le support multi-traitement et des performances de pointe. Cela comparés aux architectures concurrentes, qui ne fournissent efficacité énergétique aux niveaux les plus bas de l'opération. L'A53 / A57 améliore la déjà impressionnante Exynos 5 puce Octa, et semble être un processeur exceptionnelle quand il frappe finalement le marché.

Alors une comparaison directe entre l'Exynos 5 Octa et l'A53 / A57 est pas exactement juste, que de nouvelles puces auront des avantages évidents de vitesse, ce sont les différences de mise en œuvre de la conception qui sont vraiment la peine de noter. Le compromis entre des performances de pointe, les performances générales, et le drain de puissance de ralenti est un équilibre difficile à trouver, mais la conception de base unique, dual core / quad pour les smartphones pourrait bien être le sweet spot.




» » » Comment big.Little A53 / A57 puces seront mis à la honte de la S4 Pro, Tegra 4, et Exynos 5 Octa