Анализ SoC: Apple A9X - обзор Apple iPad Pro

  1. Графический процессор: Imagination PowerVR 12 Cluster Series 7XT
  2. Подсистема памяти: 128-битный LPDDR4-3200, без кэша L3
  3. Здание A9X Большое: 147 мм2, изготовлено TSMC

Окунувшись в самое сердце iPad Pro, у нас есть планшет Apple нового поколения SoC, A9X. Как и другие SoC Apple серии X до этого, A9X является в целом усовершенствованной и физически более крупной версией новейшей SoC телефона Apple, использующей преимущества большего пространства и рассеивания тепла, которые предоставляет планшет для производства более мощного SoC.

Apple, A9X (   Изображение предоставлено iFixit   )
Apple, A9X ( Изображение предоставлено iFixit )

То, что Apple разработала новую SoC для запуска вместе с iPad Pro, ни в коем случае не удивительно, но так же, как у iPad Pro есть разветвления для всей линейки iPad, когда Apple выходит на рынок высокопроизводительных планшетов, происхождение iPad Pro отражается в его компоненте выбор. Apple уже нужна была мощная SoC для iPad Air 2, чтобы поддерживать производительность при высоком разрешении экрана планшета, а iPad Pro, в свою очередь, еще сильнее увеличивает производительность Apple. Мало того, что экран с еще более высоким разрешением для привода - дисплей с разрешением 2732x2048 имеет около 66% пикселей дисплея 4K, - но теперь Apple необходимо обеспечить подходящую производительность для создания контента и многозадачной работы. Я не хочу подразумевать, что A9X был как-то специально разработан для iPad Pro с нуля, так как есть ряд более важных технических соображений, но я хочу подчеркнуть, что iPad Pro - это не просто еще один iPad, и что По мере того как Apple расширяет возможности iPad, им также необходимо увеличивать производительность, если они хотят расширить свою репутацию для бесперебойной работы UX.

Глядя на технические характеристики A9X, кажется, что Apple всегда бросает нам кривая на SoC серии X, и для их последних SoC это ничем не отличается. С A8X Apple предоставила больше оперативной памяти на более широкой шине памяти, более крупном графическом процессоре и, что удивительно, на трех процессорных ядрах Typhoon. На сегодняшний день до сих пор неясно, почему Apple выбрала три ядра процессора для A8X - для многозадачности или в качестве альтернативного средства повышения производительности - а конфигурация A9X служит только для освещения этой загадки.

Сравнение Apple SoC A9X A9 A8X A6X ЦП 2x Twister 2x Twister 3x Тайфун 2x Swift CPU Тактовая частота 2,26 ГГц 1,85 ГГц 1,5 ГГц 1,3 ГГц GPU 12 кластерных серий 7XT PVR 6 кластерных серий7
(PVR GT7600) Серия кластеров PVR 86XT
(APL GXA6850) PVR SGX554 MP4 RAM 4 ГБ LPDDR4 2 ГБ LPDDR4 2 ГБ LPDDR3 1 ГБ LPDDR2 Ширина шины памяти 128-битная 64-битная 128-битная 128-битная Пропускная способность памяти 51,2 ГБ / с 25,6 ГБ / с 25,6 ГБ / с 17,1 ГБ / с L2 Кэш- память 3 МБ, 3 МБ, 2 МБ, 1 МБ, кэш- память третьего уровня. 4 МБ, 4 МБ. Не доступно. Процесс производства TSMC 16 нм FinFET TSMC 16 нм
Samsung 14 нм TSMC 20 нм Samsung 32 нм

Вместо того чтобы продолжать разработку трехъядерного процессора для A9X, для их последней серии X SoC Apple опустилась до пары ядер Twister. Подвох - и почему два ядра во многом лучше трех - заключается в том, что по сравнению с A8X и A9 Apple увеличила тактовую частоту своих процессоров. Путь, путь вверх. В то время как iPad Air 2 (A8X) поставляется с тактовой частотой 1,5 ГГц, а iPhone 6s (A9) с тактовой частотой 1,85 ГГц, A9X видит, что Apple разогнала тактовую частоту до 2,26 ГГц. Не считая архитектурных изменений, это на 22% выше, чем у A9, и на 51% выше, чем у A8X.

Тот факт, что Apple отказалась от двухъядерных процессоров, неожидан, учитывая, что мы не ожидаем, что Apple когда-либо пойдет в обратном направлении, и хотя мы никогда не узнаем официальную причину всего, что делает Apple, оглядываясь назад, я Начинаю думать, что A8X - это аномалия, и Apple, на самом деле, не очень-то хотелось трехъядерный процессор. A8X появился в то время, когда Apple была связана с 20-нм процессом TSMC и не могла увеличить свои тактовые частоты без значительного увеличения энергопотребления, поэтому третье ядро ​​было гораздо более энергоэффективным вариантом.

A9X Die Shot с аннотациями AT (Die Shot Предоставлено   Chipworks   )
A9X Die Shot с аннотациями AT (Die Shot Предоставлено Chipworks )

В целом это означает, что iPad Pro и A9X установят очень высокую планку производительности процессора планшета. Как мы уже видели в обзоре iPhone 6s, ядро ​​процессора Twister является очень мощным и в большинстве случаев быстрее, чем любое другое ядро ​​процессора ARM, как на дрожжах. Повышение тактовой частоты еще на 22% служит только для того, чтобы еще больше увеличить этот разрыв, поскольку Twister теперь достигает тактовой скорости, аналогичной Cortex-A57 и A72, но с гораздо более широким конвейером выполнения и более высоким IPC. Это также является причиной того, что сравнение процессоров Intel Core настолько интересно, поскольку процессоры Intel класса Core во многих отношениях являются целью для достижения общей производительности процессора, и мы затронем этот вопрос более подробно чуть позже. ,

Графический процессор: Imagination PowerVR 12 Cluster Series 7XT

Между тем, как и ожидалось, на стороне графических процессоров Apple еще больше увеличила количество кластеров на своих SoC для управления дисплеем планшета с более высоким разрешением. В то время как A9 использовала 6-кластерную конструкцию (PVR GT7600), A9X удваивает это, что дает нам относительно массивную 12-кластерную конструкцию.

В планах PowerVR Series7XT компании Imagination у компании нет официального названия для конфигурации с 12 кластерами, поскольку она находится между 8 кластерами GT7800 и 16 кластерами GT7900. Поэтому на данный момент я просто называю это «кластер PowerVR 12, конструкция Series7XT», и, если повезет, Imagination будет использовать более детальную схему именования для будущих поколений графики PowerVR.

Поэтому на данный момент я просто называю это «кластер PowerVR 12, конструкция Series7XT», и, если повезет, Imagination будет использовать более детальную схему именования для будущих поколений графики PowerVR

В любом случае, использование 12-кластерной конструкции несколько удивительно с инженерной точки зрения, поскольку это означает, что Apple была готова пойти на пробный удар по внедрению дополнительных кластеров графических процессоров, несмотря на влияние, которое это могло бы оказать на производительность и стоимость чипов. Во всяком случае, с большей теплоемкостью и батареей iPad Pro, я ожидал, что Apple будет использовать более высокую тактовую частоту графического процессора (и съедать стоимость питания), чтобы сэкономить на затратах на чипы. Вместо этого мы видим графический процессор, который, по сути, предлагает вдвое большую мощность, чем графический процессор A9.

Однако для того, чтобы все это понять, имейте в виду, что дисплей iPad Pro имеет 5,95 мегапикселей по сравнению с 2,07 мегапиксельным экраном на iPhone 6s Plus. Таким образом, хотя Apple удвоила число кластеров графических процессоров для A9X - и я подозреваю, что синхронизировала ее довольно схожим образом - эта повышенная производительность будет очень быстро поглощена экраном высокого разрешения iPad Pro. Следовательно, даже дизайн 12-кластерного графического процессора является чем-то вроде компромисса; если бы Apple хотела поддерживать тот же уровень производительности графического процессора на пиксель, что и в семействе iPhone 6s, им потребовался бы еще более мощный графический процессор. Который просто показывает, насколько требовательными могут быть таблетки.

Подсистема памяти: 128-битный LPDDR4-3200, без кэша L3

Ответственность за кормление зверя, являющегося графическим процессором A9X, ложится на конфигурацию 128-битного контроллера памяти LPDDR4 A9X. При вдвое большем количестве кластеров графических процессоров Apple требуется вдвое большая пропускная способность памяти, чтобы поддерживать такое же соотношение пропускной способности к ядру, поэтому, как и в предыдущих планшетах SoC серии X, A9X реализует 128-битную шину. Для Apple это означает, что теперь у них есть значительная пропускная способность памяти 51,2 ГБ / с. Для SoC это огромная полоса пропускания, но в то же время она быстро будет использоваться этими 12 кластерами GPU.

Geekbench 3 Сравнение пропускной способности памяти (1 поток) Потоковое копирование Потоковое масштабирование Поток Добавить потоковую триаду Apple A9X 2,26 ГГц 20,8 ГБ / с 15,0 ГБ / с 15,3 ГБ / с 15,1 ГБ / с Apple A8X 1,5 ГГц 14,2 ГБ / с 7,44 ГБ / с 7,54 ГБ / с 7,49 ГБ / с A9X Преимущество 46,4% 101% 103% 102%

Также при рассмотрении подсистемы памяти A9X мы находим наш второй и последний кривая для A9X: кэш-память L3. Вернее, его отсутствие. Уже несколько поколений Apple использует кэш-память L3 на своих SoC для телефонов и планшетов, чтобы обеспечить питание как процессора, так и графического процессора, поскольку даже быстрая шина памяти не справляется с локальным кешем с низкой задержкой. Даже недавно, как A9, Apple включала 4 МБ кэш-памяти жертв. Однако для A9X нет кэша L3; единственные кэши в чипе - это отдельные кэши L1 и L2 для CPU и GPU, а также некоторые еще меньшие объемы для кэша для различных других функциональных блоков.

Большой вопрос сейчас, почему Apple сделает это. Наша традиционная мудрость здесь заключается в том, что кэш L3 был установлен для обслуживания как процессора, так и графического процессора, но особенно графического процессора. Рендеринг графики - это операция, интенсивно использующая пропускную способность памяти, и, поскольку Apple неизменно значительно опережает многих других разработчиков ARM SoC по производительности графических процессоров, они стремительно идут к ограничениям производительности, налагаемым узкими интерфейсами мобильной памяти. Кэш L3, в свою очередь, уменьшит некоторую нагрузку на память и поддержит производительность как CPU, так и GPU.

Одним из объяснений может быть то, что Apple посчитала, что кеш L3 больше не нужен с 128-битной шиной памяти A9X LPDDR4; пропускная способность 51,2 ГБ / с означала, что им больше не нужен кэш, чтобы избежать зависаний графического процессора. Однако, хотя использование LPDDR4 может быть фактором, отношение Apple к пропускной способности ядра к GPU, равное примерно 4,26 ГБ / с-1, идентично ядру A9, которое имеет кэш L3. С A9X, являющимся большим A9 во многих отношениях, это уже не вся история.

Что особенно любопытно, так это то, что кеш L3 на A9 не стоил Apple больших затрат пространства. Chipworks оценивает размер кэш-блока L3 размером 4 МБ A9 в ~ 4,5 мм2, что составляет всего 3% от размера A9X. Таким образом, несмотря на то, что добавление кеша L3 обходится дорого, если только нет проблем, которые мы не можем увидеть даже при пробитии (например, маршрутизации), Apple не сильно сэкономила, избавившись от кеша L3.

Наш собственный Андрей Фрумусану подозревает, что это может быть проблема с питанием, и что Apple использовала кэш L3, чтобы сэкономить на дорогостоящих операциях с памятью на A9. С A9X, однако, это планшетный SoC, который не сталкивается с такими же ограничениями питания, и, как следствие, не нуждается в энергосберегающем кеше. Это будет связано с тем фактом, что при удвоении ядер графического процессора будет гораздо больше давления только на 4 МБ кэш-памяти по сравнению с давлением, создаваемым A9, что, в свою очередь, может привести к необходимости увеличения кэш-памяти и, в конечном итоге, еще большего размера кристалла. размер.

В его нынешнем виде нет единой очевидной причины, и вполне вероятно, что все 3 фактора - размер кристалла, LPDDR4 и потребности в энергии - все сыграли свою роль здесь, и только те, кто находится в залах One Infinite Loop, точно знают. Однако я добавлю, что, поскольку Apple удалила кэш L3, кэш L2 графического процессора должен быть значительным. Для технологии отложенного рендеринга на основе плиток в Imagination необходим встроенный в кристалл кэш для хранения плиток, и, хотя им не нужен кеш всего кадра (который на iPad Pro будет превышать 21 МБ), им достаточно кеша для держать одну плитку. Гораздо сложнее оценить размер кеша GPU L2 по меткому броску (особенно с асимметричным дизайном Apple), но я не удивлюсь, если кеш A9X GPU L2 больше, чем A9 или A8X.

Здание A9X Большое: 147 мм2, изготовлено TSMC

Наконец, давайте поговорим о конструкции и изготовлении самой SoC A9X. Предыдущий анализ Chipworks показывает, что размер кристалла A9X составляет примерно 147 мм2, и что он изготовлен TSMC по 16-нм процессу FinFET.

На 147 мм2 A9X является вторым по величине среди планшетов Apple X-серии. Только A5X, первый такой SoC, был больше. Соответствующе, это было также построено относительно столь же большого SoC телефона Apple A5. Имея только 3 предыдущих SoC для планшетов, которые можно использовать для сравнения, я не уверен, что можно сказать, что Apple любит придерживаться, но после двух поколений SoC в диапазоне от 120 мм до 130 мм2 A9X заметно больше ,

Отчасти это происходит из-за того, что сам A9 немного больше обычного - версия TSMC - 104,5 мм2 - но Apple также явно добавила немало в SoC. Подстановочный знак здесь - это то, как выглядят урожаи для Apple, поскольку это многое говорит нам о том, является ли 149 мм2 A9X большой частью, или если Apple приняла на себя больший риск, чем обычно, здесь.

A9X по-прежнему является крупнейшей 16-нм ASF FinFET, которую мы знаем, которая находится в массовом производстве на TSMC (пока мы будем игнорировать ПЛИС), и, хотя это, несомненно, изменится чуть позже в этом году, как только появятся дискретные графические процессоры следующего поколения, я не думаю, что вы найдете лучший пример того, как рынок контрактных чипов изменился за одно поколение. 4 года назад это были графические процессоры, лидирующие в зарядке, но теперь это SoCs для телефонов и довольно значительный SoC для планшетов, которые первыми выйдут из-под контроля. После почти десятилетия догоняющих решений SoC теперь достигли передового края в производстве чипов, что позволило быстро увеличить производительность, но также унаследовало риски быть лидером. Я не буду подробно останавливаться на этом, но мне очень любопытно, каковы выходы A9X в качестве самой большой FinFET ASIC на TSMC, а также на том, какую часть мощности FinFET TSMC Apple потребляет при производстве A9 и A9X ,

Наконец, также интересно отметить, насколько большой A9X по сравнению с другими высокопроизводительными процессорами. Процессоры Intel Skylake последнего поколения имеют размеры ~ 99 мм2 для конфигурации с 2 ядрами GT2 (Skylake-Y 2 + 2), и даже конфигурация с 4 ядрами настольного компьютера GT2 (Intel Skylake-K 4 + 2) составляет всего 122 мм2. Таким образом, A9X больше, чем любое из этих процессорных ядер, хотя, по общему признанию, в целом SoC A9X содержит ряд функциональных блоков, которых нет ни в Skylake, ни в Skylake Platform Controller Hub (PCH). Тем не менее, это первый случай, когда Apple выпустила SoC для планшета больше, чем четырехъядерный процессор Intel для настольных ПК.