Процессоры Arm Cortex-X1 и Cortex-A78: большие ядра с большими различиями
Arm имеет не один, а два новых высокопроизводительных ЦП, предназначенных для 2021 мобильных SoC. Первым является ожидаемый Cortex-A78, основанный на стандартной дорожной карте Cortex-A. Неожиданным объявлением является Cortex-X1, мощный процессор, разработанный совместно с партнерами в новой программе Arm CXC, которая заменяет «Построенный на Arm Cortex».
Arm Cortex-A78 и Cortex-X1 оба основаны на Cortex-A77 предыдущего поколения. Тем не менее, два процессора ARM разработаны с учетом различных целей проектирования. Cortex-A78 ориентирован на обеспечение большей производительности на ватт в пределах немного меньшей площади, чем раньше. Cortex-X1 отбрасывает эти обычные проблемы в погоне за максимальной производительностью.
Оба процессора предназначены для 20-го уровня SoC и смартфонов высшего уровня, возможно, даже в сочетании друг с другом. Однако не каждый чипсет 2021 обязательно будет предлагать экстремальную производительность Cortex-X1. Он доступен только участникам программы Arm CXC. Но об этом позже, давайте посмотрим, что нового для процессоров 2021 для смартфонов.
Arm Cortex-A78: эффективность – игра
Давайте начнем с метрики для вас номера наркоманов. Arm Cortex-A78 обещает 20% -ное повышение устойчивой производительности по сравнению с Cortex-A77 при бюджете мощности 1 Вт, благодаря изменениям архитектуры, доступному увеличению тактовой частоты и переходу от 7 нм к 5 нм производства. Еще более впечатляет то, что 5-нм Cortex-A78 с частотой 2,1 ГГц потребляет на 50% меньше энергии, чем 7-нм Cortex-A77 с частотой 2,3 ГГц, согласно данным Arm. Это благо для батареи.
При одинаковом процессе производительность Cortex-A78 немного менее впечатляет. По сравнению с пересмотренной микроархитектурой общее улучшение производительности составляет всего 7%. Однако это приводит к снижению энергопотребления на 4%, поэтому ожидайте, что Cortex-A78 сохранит пиковую производительность чуть дольше, чем A77 и A76. A78 также на 5% меньше, что приводит к 15% экономии площади для четырехъядерного кластера. Это освобождает больше места для дополнительных графических процессоров, NPU или других компонентов на кремнии или просто помогает снизить цены.
Обращаясь к микроархитектуре, Arm внесла ряд существенных изменений. Начнем с того, что Cortex-A78 поставляется с опциональной конфигурацией кэша L1 меньшего размера – 32 КБ, в которой достигается основная экономия места. Хотя партнеры Arm по-прежнему могут выбрать более привычный кэш L1 объемом 64 КБ для дальнейшего повышения производительности ядра. Qualcomm сделал нечто похожее с большими кэшами L2 для своего ядра Snapdragon Prime, и это остается гибким до 512 КБ, чтобы сбалансировать производительность, площадь и мощность этого поколения.
Чтобы компенсировать эту меньшую память L1, предиктор ветвлений лучше справляется с нерегулярными шаблонами поиска и теперь способен отслеживать две взятые ветви за цикл. Это приводит к меньшему количеству пропусков кэша L1 и помогает скрыть пузырьки конвейера, чтобы ядро работало хорошо Трубопровод на 1 цикл длиннее по сравнению с A77, что обеспечивает достижение A78 целевого значения тактовой частоты около 3 ГГц, но это все равно 6 команд на цикл.
Cortex-A78 оптимизирует мощность и площадь, с более консервативными улучшениями производительности.
Arm также вводит второй целочисленный множественный блок в исполнительный блок и дополнительный блок генерирования адресов (AGU) для увеличения пропускной способности загрузки данных на 50%. Другие оптимизации включают в себя более объединенные инструкции и улучшения эффективности для планировщиков команд, структур переименования регистров и буфера переупорядочения. Суть в том, что Cortex-A78 является более экономичным и оптимизированным процессором, чем A77.
Cortex-A78 нацелен на максимальную эффективность по сравнению с производительностью. Это отлично подходит для работы от батареи, но не так хорошо для энтузиастов, которые надеются, что Android в следующем году сократит разрыв с Apple Для этого вам понадобится телефон от Arm Cortex-X1.
Больше от Arm: анонсированы графики Mali-G78 и Mali-G68
Arm Cortex-X1: высочайшая производительность
Cortex-X1 – первый выпускник новой программы Arm CXC. С CXC партнеры Arm получают преимущество от обычной дорожной карты, и Arm разрабатывает для них CPU. Тем не менее, партнер должен быть в программе с самого начала, чтобы иметь доступ к конечному продукту. В этом году коллективный подход заключается в том, чтобы серьезно повысить производительность линейки Arm Cortex.
Для Cortex-X1 Arm ожидает 30-процентный скачок производительности по сравнению с Cortex-A77. Это дает впечатляющий 23-процентный прирост по сравнению с Cortex-A78 при целочисленном сжатии, что делает его явным победителем в требовательных рабочих нагрузках. Cortex-X1 также может похвастаться удвоенным мастерством машинного обучения этих двух процессоров.
Cortex-X1 отвечает на запросы процессора Arm с экстремальной производительностью.
Это существенное изменение в подходе, но эта скорость достигается за счет увеличения площади поверхности и увеличения мощности. Для партнеров Arm это означает снижение многопоточной производительности и эффективности на квадратный миллиметр кремния. Таким образом, маловероятно, что смартфоны SoC будут использовать четырехъядерные кластеры Cortex-X1. Мы с большей вероятностью увидим один Cortex-X1 в паре с тремя Cortex-A78. Такая конфигурация занимает только 15% больше площади, чем четырехъядерный кластер Cortex-A76, обеспечивая при этом столь востребованное однопоточное усиление.
Для достижения целевой производительности Cortex-X1 потребовался ряд серьезных изменений в микроархитектуре. Для начала, ядро имеет гораздо больше памяти, чем A77 и A78. Кэш-память L2 имеет переменную до 1 МБ и имеет удвоенную пропускную способность, чтобы максимизировать выигрыш в производительности, в то время как общий кэш-память L3 может достигать 8 МБ, что вдвое больше, чем у предыдущих поколений. Интересно, что в Cortex-X1 включен специальный динамический общий блок (DSU) для конфигурации 8 МБ, который разделяет эту память с любыми Cortex-A78 в кластере.
Большой кеш дополняется более мощным ядром исполнения. Обработка команд с плавающей запятой SIMD удваивается до 4x-128 битов полосы пропускания, обеспечивая 2-кратное повышение скорости машинного обучения. Процессор также может похвастаться 40% -ным увеличением своего окна выполнения вне очереди с 224 инструкциями ввода. Это предоставляет больше параллелизма на уровне команд, чтобы процессор мог делать больше одновременно.
Большое ядро X1 требует большей мощности и кремниевой площади.
Все, что нужно сделать, – это целевой буфер ветки L0 на 50% больше, выборка команд I-кэша шириной 5 и выборка 8 микроопераций из выделенного кэша Mop. Это вдвое больше, чем у Cortex-A77, и на 33% больше, чем у A78 с 6-полосной пропускной способностью. Другими словами, Cortex-X1 может делать намного больше с каждым тактом, чем предыдущие ядра Arm.
Рука Cortex-A78 против Cortex-X1
Большая часть прироста производительности Arm Cortex-A78 обусловлена переходом на 5 нм, что делает его самым консервативным улучшением поколений за последние несколько лет. Вместо этого оптимизация области и производительности являются ключевыми темами для обсуждения, что, конечно же, хорошо для работы от батареи гаджета. Важно отметить, что этот выбор конструкции дополняет электростанцию Cortex-X1 в смешанных кластерных конфигурациях.
Трехуровневая SoC с одним X1, тремя A78 и четырьмя A55 может обеспечить отличный баланс производительности и эффективности для смартфонов, повышая производительность Android, чтобы конкурировать с пользовательскими процессорами Apple. Многоядерный процессор Cortex-X1 SoC также представляет собой захватывающую перспективу для экосистемы Windows on Arm, предоставляя возможности для высококлассного рынка компьютеров.
Мы еще не знаем, у каких производителей есть Cortex-X1, но Qualcomm кажется вероятным.
Однако природа программы CXC создает новую перспективу, заключающуюся в том, что не каждый разработчик мобильных SoC имеет доступ к ядру Arm с самой высокой производительностью. Мы еще не знаем, кто участвует в программе, но Qualcomm кажется верной вещью, так как он ранее участвовал в Built on Arm Cortex для Kryo. Это может дать Snapdragon следующего поколения преимущество перед конкурентами. Cortex-A78 расширяется за счет увеличения конфигурации кэша для тех, кому нужна дополнительная производительность, но партнеры CXC будут иметь заметное преимущество.
Появление не одного, а двух больших ядер Cortex-A знаменует собой значительный сдвиг в стратегии для Arm, который приведет к серьезной дифференциации продуктов в смартфонах следующего года и всегда подключенных ноутбуках. Следите за объявлениями SoC от основных игроков к концу 2020 года, чтобы увидеть, как это получится.
Источник записи: https://www.androidauthority.com