Оригинал материала: https://3dnews.ru./617138

Intel Ivy Bridge: подробности о микроархитектуре

Прошедшая неделя была ознаменована сразу несколькими большими событиями, проливающими свет на будущее персональных компьютеров и индустрии в целом. Компания Microsoft познакомила разработчиков с перспективной версией своей операционной системы, Windows 8, которая должна стать единой программной средой для всех будущих компьютерных устройств. Intel на специальном мероприятии Intel Develper Forum рассказала о разрабатываемых в недрах компании продуктах и технологиях. А AMD пыталась привлечь к себе внимание публики, поочерёдно приоткрывая завесу тайны над процессорами Bulldozer и Trinity и над будущими графическими ускорителями семейства Southern Islands.

Всё это с разной степенью подробности освещалось в наших новостях, но одна тема заинтересовала нас немного больше. А именно: мы решили досконально разобраться в том, чем же будет выделяться следующее поколение интеловских процессоров Ivy Bridge, встреча с которым нас ожидает в первой половине 2012 года. Благо в рамках прошедшей сессии IDF этому вопросу было отведено немало внимания, и теперь мы располагаем достаточно подробной информаций, пришедшей «из первых рук».

Ivy Bridge в мобильном исполнении

Тема Ivy Bridge привлекательна для нас в первую очередь потому, что до сих пор про эту микроархитектуру были известны лишь какие-то отрывочные сведения, в то время как более близкие Bulldozer и Sandy Bridge-E «изъезжены» обозревателями вдоль и поперёк. Поэтому давайте мысленно перешагнём через воображаемый рубеж в несколько месяцев и посмотрим, чем нас собирается порадовать Intel в 2012 году.

#Новый технологический процесс, но не только

Уже в течение пяти лет выход новых поколений процессоров у Intel происходит в соответствии со стратегией Tick-Tock («тик-так»). Суть это принципа заключается в том, что перевод производства на новый технологический процесс и внедрение усовершенствованных версий микроархитектуры происходит поочерёдно, примерно с двухгодичным периодом.

Таким образом, Ivy Bridge должен стать следующим «тиком», в рамках которого производственный процесс начнёт использовать 22-нм нормы. Надо сказать, что совершенствование техпроцесса в этот раз станет не совсем ординарным шагом, так как Intel планирует внедрить кардинальные изменения и в базовую структуру транзисторов. Традиционные планарные транзисторы, применявшиеся в полупроводниковых устройствах на протяжении многих лет, с переходом на 22-нм нормы производства будут заменены более совершенными транзисторами с трехмерной конструкцией (Tri-Gate).

Обновленная версия транзистора отличается использованием затвора в виде тонкой трехмерной кремниевой пластины, установленной перпендикулярно кремниевому субстрату. Прохождение тока в этом случае контролируется тремя затворами, расположенными на гранях пластины. Такое усовершенствование при минимальных геометрических размерах транзисторов обеспечивает максимальную величину тока во включенном состоянии и приближенную к нулю — в выключенном. В результате не только ускоряется переключение, но и уменьшаются паразитные токи утечки.

Практическим результатом усовершенствований в технологическом процессе может стать как повышение тактовых частот процессоров, так и беспрепятственное снижение их напряжения питания и соответствующее падение тепловыделения. Приведённый график говорит о том, что с вводом 22-нм техпроцесса Intel имеет возможность снизить рабочее напряжение на 0,2 В, но сохранить при этом достигнутые на данный момент тактовые частоты. И если бы будущие 22-нм процессоры использовали сегодняшнюю микроархитектуру Sandy Bridge, это бы означало примерно 37-процентное падение энергопотребления и тепловыделения.

Столь впечатляющее технологическое достижение фактически развязало руки разработчикам. Intel и так с переходом на новые производственные технологии редко воздерживалась от внесения изменений в микроархитектуру. Теперь же унимать полёт инженерной мысли и вовсе не было никакого резона. В результате Ivy Bridge станет не результатом перевода Sandy Bridge на новые «полупроводниковые рельсы», а процессором со значительно улучшенной микроархитектурой.

Вот так, собственными же стараниями Intel поставила под сомнение стратегию «тик-так». Правда, дабы сохранить лицо, представители компании стали применительно к Ivy Bridge оперировать термином «тик+», однако это лишь подчёркивает, что изначальная концепция дышит на ладан.

Говоря вкратце, изменений в Ivy Bridge стоит ждать по всем фронтам. Но ключевые улучшения, наиболее бросающиеся в глаза после знакомства с новой микроархитектурой, следующие:

  • Новый 22-нм технологический процесс с использованием трёхмерных транзисторов уменьшит тепловыделение;
  • Будет внедрён новый подход к управлению тепловыделением: конфигурируемый TDP;
  • Графическое ядро Ivy Bridge получит существенно повышенную производительность и поддержку DirextX 11;
  • В процессоре добавится встроенный аппаратный генератор случайных чисел и защита ОС от атак типа «повышение привилегий»;
  • Контроллер памяти получит поддержку более скоростной и низковольтовой памяти.

При этом базовые принципы построения процессоров с микроархитектурой Ivy Bridge останутся такими же, как и у Sandy Bridge. Так же как и предшественники, они будут базироваться на едином полупроводниковом кристалле, включающем одновременно вычислительные и графическое ядра. Кеш третьего уровня сохранит модульную структуру и останется доступным для всех процессорных блоков. На своём месте в процессоре останутся интегрированные контроллеры памяти и шины PCI Express. А все перечисленные составные компоненты CPU будут объединяться в единое целое хорошо зарекомендовавшей себя кольцевой шиной.

Более того, с выходом Ivy Bridge компания Intel не планирует как-то изменять линейку продукции и даже божится сохранить их совместимость с существующей LGA1155-инфраструктурой.

Впрочем, при разговорах о совместимости делается важная ремарка. Ситуация с конкретными материнскими платами может зависеть от BIOS. Так что неприятные казусы с какими-то конкретными платформами всё-таки возможны.

Вместе с тем Intel собирается предложить для Ivy Bridge и новые наборы логики седьмой серии. Но цель их выпуска состоит не в том, чтобы снабдить процессоры собственной узкоспециализированной платформой, а в том, чтобы немного актуализировать платформу LGA1155 — добавить в неё врождённую поддержку USB 3.0 и дополнительную функциональность SATA-контроллера.

Intel Z77 Intel Z75 Intel H77
Поддержка процессоров Ivy Bridge / LGA1155 Ivy Bridge / LGA1155 Ivy Bridge / LGA1155
Разгон процессора Поддерживается Поддерживается Не поддерживается
Конфигурации процессорной PCIe 1 x16 или 2 x8 или 1 x8 + 2 x4 PCI Express 3.0 1 x16 или 2 x8 PCI Express 3.0 1 x16 PCI Express 3.0
Поддержка интегрированной графики Есть Есть Есть
SSD-кеширование Поддерживается Не поддерживается Поддерживается
RAID Поддерживается Поддерживается Поддерживается
Порты USB (USB 3.0) 14 (4) 14 (4) 14 (4)
Порты SATA (SATA 6 Гбит/сек) 6 (2) 6 (2) 6 (2)
Дополнительные линии PCI Express 2.0 8 8 8
Поддержка PCI Нет Нет Нет

Впрочем, не будем слишком отклоняться от темы и сосредоточимся на том, что нам предложат именно процессоры следующего поколения.

#Управление для тепловыделения

В том, что новый 22-нм технологический процесс с использованием трёхмерных транзисторов существенно поспособствует снижению тепловыделения перспективных процессоров, можно не сомневаться. Резюмируя запланированные изменения в микроархитектуре и в производственной технологии Ivy Bridge, представители Intel пообещали, что соотношение производительности и энергопотребления по сравнению с Sandy Bridge может почти удвоиться. Хорошей иллюстрацией ожидаемого прогресса может выступить тот факт, что микроархитектура Ivy Bridge позволит наладить выпуск четырёхъядерных мобильных процессоров с типичным тепловыделением в пределах 35 Вт.

Однако движет Intel на пути оптимизации удельной производительности в пересчёте на каждый ватт затраченной энергии не столько желание предложить пользователям мобильных компьютеров общеупотребительные модели с четырехъядерными процессорами, сколько стремление добиться широкого распространения продвигаемых компанией ультрабуков — нового типа мобильных компьютеров, которые должны объединить в себе плюсы планшетов и классических ноутбуков. Для этого класса устройств будет предложен широкий выбор недорогих двухъядерных процессоров Ivy Bridge с типичным тепловыделением 17 Вт.

Вообще, изменений, полезных именно при ультрабучной ориентации, в Ivy Bridge прослеживается немало. Например, именно с таким прицелом в контроллер памяти Ivy Bridge добавили дополнительную поддержку стандарта DDR3L — памяти с пониженным энергопотреблением, которая питается от напряжения 1,35 В. Причём речь идёт не столько об обеспечении более низких сигнальных напряжений, сколько об отключении питания от памяти в состояниях глубокого сна, что в конечном итоге должно положительно отразиться на времени работы будущих мобильных компьютеров от батареи.

Но, конечно, самая интересная и важная возможность Ivy Bridge с точки зрения управления тепловыделением и энергопотреблением — это конфигурируемый TDP.

В настоящее время каждая модель процессора Intel обладает чётко обозначенным уровнем TDP, в рамках которого процессор иногда может повышать тактовую частоту при работе технологии Turbo Boost. Будущие же процессоры поколения Ivy Bridge смогут иметь три значения TDP для каждой модели: минимальное, номинальное и максимальное. Это значит, что при наличии подходящих условий для эффективного охлаждения и при достаточном питании процессор получит возможность существенно повышать свою рабочую частоту, наплевав на ограничения по номинальному TDP, чего технология Turbo Boost в её нынешнем виде сделать не позволяет, так как она к уровню TDP жёстко привязана. Ну и наоборот — если по каким-то причинам нужно начать неистово экономить электроэнергию, то TDP для процессора можно будет перевести на более низкий уровень.

Технология эта нацеливается, естественно, под мобильные применения, где она имеет реальный смысл. Например, если мобильный компьютер работает от сети и комплектуется дополнительной охлаждающей подставкой (или док-станцией), TDP и, соответственно, тактовую частоту его процессора можно беспрепятственно повысить, за счёт чего добиться увеличения производительности. И наоборот, в каких-то ситуациях пользователь может захотеть обеспечить дополнительную экономию заряда батареи, и в этом случае TDP процессора имеет смысл уменьшить.

Конфигурируемое TDP никак не связано с Enhanced Intel SpeedStep и Turbo Boost в том смысле, что все три технологии способны работать одновременно. Коренные же различия между ними состоят в том, что Enhanced Intel SpeedStep и Turbo Boost используют автономные алгоритмы, а конфигурируемое TDP работает в ручном режиме. То есть за переключение уровней TDP будет отвечать либо сам пользователь, которому на корпус ноутбука будет выведен соответствующий переключатель, либо программное обеспечение, которое будет разрабатываться и поставляться производителем ноутбука. Intel предполагает также, что, используя описанное свойство Ivy Bridge, какие-то производители мобильных систем захотят предлагать продукты с изначально переконфигурированными под сниженное TDP процессорами.

В качестве конкретного примера CPU с конфигурируемым TDP представителями Intel описываются ULV-процессоры, ориентированные на использование в составе ультрабуков. Их номинальное типичное тепловыделение будет установлено в 17 Вт, но они будут иметь два дополнительных уровня TDP — увеличенный, равный 33 Вт, и уменьшенный — 13 Вт.

Кроме того, Intel замыслила реализовать и ещё одну хитрость, направленную на снижение тепловыделения и энергопотребления. Речь идёт об изменении привычных алгоритмов работы системного агента, активируемых в экономичном режиме. По замыслу разработчиков, процессор сможет обеспечить дополнительную экономию за счёт того, что все исполняемые потоки будут переноситься на минимальное количество активных вычислительных ядер. Благодаря этому возможность переключения в энергосберегающие состояния будет доступна для максимального количества ядер. Такой подход действительно имеет смысл, так как при обычной работе потоки распределяются по ядрам равномерно с целью улучшить отзывчивость системы.

#Оверклокерам — отдельное внимание

Микроархитектура Ivy Bridge сулит небывалый прогресс в сегменте мобильных компьютеров. Однако с надеждой на неё смотрят и энтузиасты, предпочитающие настольные системы. Дело в том, что переход на новый технологический процесс почти всегда обеспечивает повышение тактовых частот процессоров если не в номинальном режиме, то, как минимум, при разгоне. Так что, учитывая все прелести нового 22-нм техпроцесса с трёхмерными транзисторами, Ivy Bridge может оказаться весьма интересным вариантом для оверклокеров.

Впрочем, в платформе LGA1155 в её современном виде оверклокеров раздражает не низкий частотный потенциал процессоров Sandy Bridge, а то, что их невозможно нормально разогнать увеличением базовой частоты. К сожалению, похоже, в Ivy Bridge в этом плане ничего не изменится и полноценный разгон останется прерогативой лишь небольшого количества специализированных оверклокерских моделей CPU. Однако Intel не совсем забыла про энтузиастов и в перспективные процессоры собирается добавить четыре достаточно полезные для разгона вещи.

Во-первых, максимально достижимый множитель для процессоров Ivy Bridge составит x63, а не x57, как раньше. Соответственно, экстремальные оверклокеры, которые любят на досуге поэкспериментировать с жидким азотом, смогут в LGA1155-системах выжимать более высокие частоты. Впрочем, об установлении мировых рекордов, подобных достижению частоты 8,45 ГГц на Bulldozer, речь всё-таки не идёт.

Во-вторых, Intel добавит в контроллер памяти возможность использования гораздо более скоростной, чем сейчас, DDR3 SDRAM. В системах, основанных на Sandy Bridge, максимально доступный режим — это DDR3-2133. Ivy Bridge обещает совместимость с режимами вплоть до DDR3-2800 и со спецификацией XMP 1.3, допускающей такие частоты. Пока что подобной скоростной памяти в продаже нет, но за следующий год дотянуться до столь высоких частот DDR3 SDRAM вполне сможет. Тем более что уже сейчас на рынке есть DDR3-2600 компании Corsair и DDR3-2400 сразу нескольких производителей.

В-третьих, при разгоне памяти нам пообещали и меньший, чем нынешние 266 МГц, шаг приращения её частоты. Судя по имеющимся данным, он составит не более 200 МГц.

И в-четвёртых, разработчики Intel намерены реализовать возможность динамического изменения множителя процессора без необходимости перезагрузки системы. Это означает, что смогут появиться утилиты, беспрепятственно изменяющие частоту процессора прямо из операционной системы. Причём для таких программ станет возможным не просто разгонять процессор, но и интерактивно управлять его частотой по каким-нибудь хитрым алгоритмам, например в зависимости от нагрузки или от температуры. Иными словами, Intel собирается вручить в руки продвинутых пользователей, предпочитающих процессоры с разблокированным множителем, что-то подобное продвинутой и конфигурируемой технологии Turbo Boost.

#Основной фокус — на графике

Всё рассказанное о Ivy Bridge выше мало касалось собственно микроархитектуры. Однако знакомство с тем, что же в перспективных процессорах стало с графическим ядром, не оставляет никаких сомнений, что в потрохах микроархитектуры тоже покопались основательно. Новое графическое ядро Ivy Bridge, имеющее кодовое имя Carlow, будет не просто значительно быстрее, чем текущие ядра Intel HD Graphics 2000/3000. Оно также предложит и принципиально новые функции, фактически становясь следующим поколением интеловских GPU. Так что графика — это даже не «тик+», а явный «так»: в Carlow есть одновременно и внутренние оптимизации, и поддержка новых возможностей, и улучшения, направленные на снижение тепловыделения.

Даже если не вдаваться в технические подробности, то и с точки зрения простого пользователя найдётся целый ряд позитивных изменений. Так, в целом производительность графики должна возрасти по предварительным оценкам на 60 % по сравнению с текущими интеловскими интегрированными GPU. Это, кстати, вполне может поставить Ivy Bridge в один ряд с AMD Llano, то есть в следующем году мы наконец получим полноценный APU и от Intel. Причём полноценный безо всяких оговорок. В нём будет реализована поддержка DirectX 11 и OpenGL 3.1 — самых современных на данный момент графических API — и даже поддержка OpenCL 1.1 силами шейдерных процессоров. Последнее особенно важно, потому что, используя Ivy Bridge, можно будет решать на графических ядрах счётные задачи — то, что APU компании AMD умеют делать с самого рождения.

Блок-схема графического ядра приведена на следующем рисунке:

Рост производительности графического ядра следующего поколения в первую очередь обуславливается увеличением количества исполнительных устройств. В Sandy Bridge максимальное количество таких устройств — 12, при этом на каждое из них приходится по одному текстурному блоку. В Ivy Bridge максимальное число исполнительных устройств вырастет до 16, причём на каждое будет полагаться по два блока текстурирования. Ещё одно важное изменение — добавление в графическое ядро собственной быстрой кеш-памяти.

Впрочем, нововведения в GPU носят не только экстенсивный характер. В графическое ядро Ivy Bridge добавлены блоки для аппаратной тесселяции, а также внесена поддержка Shader Array (что, собственно, и позволило добиться совместимости с Shader Model 5.0 и DirectX 11). Много изменений направлено и на ускорение или улучшение каких-то конкретных операций. Например, в корне переработаны алгоритмы анизотропной фильтрации, которая в будущем графическом ядре Carlow должна будет выполняться на порядок качественнее.

Любопытно, что вместе с микроархитектурными доработками разработчики перетасовали расположение элементов графического ядра на полупроводниковом кристалле. Ядро распалось на пять доменов, и, очевидно, пользуясь новой модульной структурой, Intel собирается предложить большее, чем сейчас, число модификаций интегрированной графики, различающихся по производительности и возможностям.

Что же касается тактовой частоты GPU, то в Ivy Bridge она будет существенно ниже, чем в Sandy Bridge. Инженеры Intel посчитали, что таким образом они смогут понизить энергопотребление, а изменённая микроархитектура графического ядра обеспечивает вполне достаточный рост быстродействия и так. В целом же, говоря о мощности Carlow, Intel обещает двукратное превосходство над HD Graphics 2000/3000 с точки зрения соотношения производительности на ватт.

Инновации не обошли стороной и технологию Quick Sync. Вторая версия этой технологии обещает не только улучшенную производительность, но и дополнительные функции, обеспечивающие улучшение качества кодирования и добавление возможности применения к перекодируемому видеопотоку несложных фильтров типа улучшения цветовой гаммы или контрастности. Скорость же обычного перекодирования HD-видео с применением специализированных процессорных блоков, как ожидается, возрастёт примерно вдвое. И, кстати, новая версия Quick Sync получит поддержку MVC, то есть с её помощью станет возможным перекодирование стерео 3D-видеоконтента.

Параллельно улучшится и аппаратный видеодекодер. Его мощности будет хватать для одновременного воспроизведения не менее 16 видеопотоков высокого разрешения, и к тому же он сможет работать с пост-Full HD-видеоконтентом в формате 4096x2304.

Определённую работу специалисты Intel провели и в части совершенствования возможностей вывода изображения. Графика Ivy Bridge при условии использования этих процессоров вместе с материнскими платами на будущих чипсетах седьмой серии сможет выводить изображение на три независимых дисплея (Sandy Bridge умеет только на два). Плюс в будущих платах добавится реализация HDMI-интерфейса версии 1.4 с поддержкой передачи 3D.

#Микроархитектурные улучшения

До сих пор мы обходили стороной непосредственно процессорные ядра Ivy Bridge. Однако это не значит, что инженеры обделили их своим вниманием. Их руки достали и дотуда. Изменений там, правда, немного, тем не менее они есть.

В первую очередь интерес вызывает появление в процессоре аппаратного датчика случайных чисел, который будет незаменим в криптографических задачах.

Здесь речь идёт не о псевдослучайном датчике, который выдаёт числа в соответствии с какой-то математической последовательностью, а о самом настоящем случайном датчике, использующем для генерации случайных чисел физический процесс с неопределённым состоянием. Часто для этой цели используется счётчик Гейгера, но Intel придумала схему, основанную на неопределённости состояния хитрой электронной полупроводниковой схемы. Это позволяет генерировать поток случайных чисел в соответствии с требованиями криптографических стандартов. Причём с высокой производительностью, достигающей 2-3 Гбит/с.

Ещё одно крайне полезное улучшение — режим Supervisory Mode Execute Protection, который должен помочь в защите от использования уязвимостей типа «повышение привилегий». Смысл этого нововведения состоит в том, чтобы закрыть для посторонних приложений доступ в имеющие более высокие привилегии сервисы операционной системы и не дать возможности пользовательским приложениям внедрять свои данные «куда не следует». Для решения этой задачи память, задействующаяся обычными программами, будет маркироваться специальным флагом, делающим невозможным исполнение её содержимого в режимах с супервизорскими полномочиями.

Кое-что сделано и для простого увеличения производительности. Правда, Intel говорит, что на серьёзное увеличение числа исполняемых за такт инструкций рассчитывать не следует, рост быстродействия на одной тактовой частоте по сравнению с Sandy Bridge должен составить порядка 4-6 %. Основное ускорение будет наблюдаться на операциях деления целых и вещественных чисел, при преобразовании данных между 16-битным и 32-битным форматом и при перемещениях строковых данных. Помимо этого, определённые улучшения внесены в менеджмент разделяемых процессорных ресурсов при работе технологии Hyper-Threading.

#Финальные замечания

В заключение рассказа о перспективных процессорах Ivy Bridge хочется привести снимок полупроводникового кристалла четырёхъядерного варианта этого процессора.

Кристалл Ivy Bridge, выпускаемый по 22-нм технологическому процессу, будет состоять из 1,48 млрд транзисторов, что означает примерно 48-процентное усложнение по сравнению с Sandy Bridge. Знаково, что столь серьёзное увеличение ядра не связано с ростом объёма кеш-памяти третьего уровня, поскольку максимальная ёмкость кеша в будущих процессорах по сравнению с Sandy Bridge не изменится и составит те же самые 8 Мбайт.

На что же будет израсходовано почти 500 млн транзисторов? В первую очередь — на графическое ядро, которое, как видно даже невооружённым взглядом, станет существенно сложнее. Напомним, в Sandy Bridge на долю графики отводилось примерно 20% полупроводникового кристалла. В Ivy Bridge же GPU оккупировал уже 32 % площади процессора, а это — почти такая же доля, как и у графики в Llano. Кажется, лучшей иллюстрации приоритетов Intel и желать не нужно: компания держит курс по проторённой дорожке — на выравнивание возможностей процессорных и графических ядер и сращивание их воедино.

Конечно, подготовленный нами по материалам IDF рассказ про Ivy Bridge не претендует на абсолютную полноту. Пока что известно далеко не всё, а лишь ключевые теоретические сведения, описывающие архитектуру. Конкретных же данных ни про частоты, ни про цены, ни про названия моделей, ни уж тем более про показатели в тестах пока нет. И это не случайно. Intel немного отодвинула сроки выпуска Ivy Bridge. Сейчас идёт речь о том, что эти процессоры начнут производиться в самом конце текущего года и будут анонсированы в марте-апреле следующего года, а это ещё только через полгода. Так что, очевидно, интересные факты про Ivy Bridge мы сообщаем далеко не в последний раз и нас ждут ещё всякие откровения.



Оригинал материала: https://3dnews.ru./617138