Оригинал материала: https://3dnews.ru./263855

45-нм процессоры Intel Penryn и Nehalem: особенности архитектуры

Стр.1 - Процессоры Penryn

Вступление

Одна из наиболее интригующих тем новостей и публикаций этого сезона – выпуск компанией Intel процессоров с соблюдением норм 45 нм техпроцесса. На страницах нашего сайта, по мере поступления подробностей о новых чипах, прошёл ряд публикаций соответствующего профиля. Сегодня мы попробуем детально рассказать о нововведениях и технологиях в новых процессорах. Попытаемся подвести некую черту под теоретическими выкладками, после которой, как известно, следуют практические испытания инженерных и розничных образцов процессоров.

Микроархитектуры ближайших лет

Прежде всего, расскажем читателям о последних планах Intel по внедрению процессорных микроархитектур в ближайшие пару лет. Процессоры для настольных ПК нового поколения с рабочим названием Penryn будут построены на базе усовершенствованной микроархитектуры Intel Core. Основным их отличием станет переход на 45-нм техпроцесс и некоторые архитектурные новшества, вследствие чего повысится энергоэффективность, расширится частотный потенциал, увеличится количество выполняемых команд за такт и прочее.
После наладки массового производства чипов Penryn, Intel планирует представить процессоры Nehalem с новой одноименной микроархитектурой - на смену Intel Core. Примерно через два-три года после анонса 45-нм процессоров – ориентировочно, ближе к 2009-2010, Intel надеется представить новый, более прецизионный 32-нм техпроцесс. Пока эти планы довольно туманны: даже переход на 45 нм сопровождался большими трудностями и потребовал задействования совершенно новых материалов (high-k диэлектрики и металлические затворы). В рамках 32 нм техпроцесса будут представлены процессоры с рабочим названием Westmere, ранее известные как Nehalem-C, с той же микроархитектурой Nehalem. Через два года после появления Nehalem на смену придет микроархитектура Gesher. О ней пока очень мало сведений. Известно лишь, что первые процессоры Gesher будут выпускаться по 32-нм техпроцессу. На этом прогнозы относительно развития процессоров заканчиваются. Судя по этим планам, Intel придерживается прежней стратегии смены микроархитектур и перехода на новый техпроцесс каждые два года. Удастся ли лидеру процессорной индустрии удерживать такие высокие темпы развития, сказать сложно. В Intel такую стратегию выпуска продукции называет “tick-tock” (“тик-так”). Каждый “тик” отражает новый этап развития полупроводниковых производственных технологий и усовершенствования в области микроархитектуры (например, Penryn). Каждый “так” соответствует созданию новой микроархитектуры (например, Nehalem).

Подробнее о процессорах Penryn

Процессоры семейства Penryn хронологически появятся раньше Nehalem, с них и начнём. Сегодня на разных стадиях разработки находятся более 15 продуктов семейства Penryn. В числе первых мы увидим чипы, ориентированные на разные секторы рынка.
До недавнего времени было известно о готовящихся к выпуску двухъядерном процессоре для ноутбуков, 2- и 4-х ядерных моделях для настольных ПК, а также 2- и 4-х ядерных процессорах для серверного сегмента. В дни Форума Intel для разработчиков в Пекине мы также узнали о планах компании по выпуску 45-нм чипов и для устройств класса UMPC (Ultra Mobile PC). Новые процессоры станут серьёзной заявкой и могут пошатнуть позиции таких производителей, как AMD, VIA Technologies и других.
Усовершенствования, которые принесет переход на новый техпроцесс, интересно рассмотреть с позиций количественного сравнения. Например, четырехъядерные процессоры Penryn будут включать около 820 млн. транзисторов, которые разместятся на двух кристаллах площадью 107 мм2. Для сравнения, современные четырехъядерные процессоры Intel Kentsfield имеют 582 млн. транзисторов, при этом площади кристаллов четырехъядерных процессоров, выпускающихся по 65-нм нормам, составляют 143 мм2.
Новшества, которые принесет следующее поколение процессоров, можно рассматривать по отношению к пяти современным технологиям Intel: Wide Dynamic Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost, Intelligent Power Capability.
Механизм Wide Dynamic Execution обеспечивает выполнение большего числа команд за один тактовый цикл, что увеличивает производительность и помогает добиться повышения энергоэффективности. В рамках этой технологии компания Intel представит усовершенствованный более быстрый блок деления, основанный на базе методики radix-16, а также улучшенную технологию виртуализации Enhanced Intel Virtualization Technology. Инновационная архитектура на базе radix-16 позволит существенно уменьшить задержки при выполнении целочисленных операций деления, а также операций деления с плавающей запятой. На нижеприведенной диаграмме вы видите красноречивые результаты, которые не требуют комментариев.
Технология Advanced Smart Cache нацелена на обеспечение более высокой производительности и эффективности кэш-памяти. В процессорах семейства Penryn компания Intel решила увеличить объем кэша. Так, двухъядерные процессоры будут оснащаться кэшем L2 емкостью до 6 Мб, а отдельные четырехъядерные модели обзаведутся 12-Мб кэш-памятью. О частотных характеристиках пока говорится в ключе преодоления планки 3 ГГц.
В рамках технологии Smart Memory Access говорится об увеличении пропускной способности шины. Подтверждается информация об освоении шины FSB 1600 МГц. Сообщается, что шина FSB 1600 МГц появится в некоторых моделях процессоров для серверов и рабочих станций; когда будут выпущены модели с высокоскоростной шиной для настольных ПК, пока не уточняется. Технология Advanced Digital Media Boost применяется для ускорения обработки видео, изображения и речевых потоков. Для повышения производительности при обработке медиаданных Intel решила добавить к архитектуре ISA набор расширений SSE4 (Streaming SIMD Extensions 4), который станет доступным для большинства массовых секторов рынка ПК с появлением 45-нм процессоров. Этот новый набор команд включает множество инновационных инструкций (их насчитывается около 50), которые условно можно разделить на две группы:
  • Примитивы векторизации для компиляторов и ускорители мультимедийных приложений;
  • Ускорители обработки строк и текстовой информации.
Пожалуй, на SSE4 остановимся детальнее, поскольку технология является одним из ключевых нововведений. Для начала опишем приложения, которые затронет это усовершенствование. Улучшения коснутся графики, кодирования и обработки видео, создания трехмерных изображений, игр, Web-серверов, серверов приложений. Как утверждает Intel, увеличится производительность приложений с высокой интенсивностью вычислений - анализа хранилищ данных, СУБД, сложных алгоритмов поиска и сопоставления, алгоритмов сжатия звука, видео, изображений и данных, алгоритмов синтаксического анализа и анализа логических состояний, а также многих других.
По словам Intel, SSE4 – самое масштабное и значительное расширение архитектуры Intel ISA со времени появления SSE2. Набор команд SSE4 содержит несколько примитивов векторизации для компиляторов, обеспечивающих дальнейшее увеличение производительности и эффективности мультимедийных приложений. Имеются также и новые инновационные инструкции для обработки строк. Еще одним усовершенствованием является механизм перестановок - Super Shuffle Engine. Новый блок умеет выполнять перестановки значений сразу во всем 128-разрядном регистре за один такт. Это существенно повышает производительность при обработке операций, связанных с перестановкой (упаковка, распаковка, сдвиг упакованных значений, вставка). Сравнение количества тактов, нужных для выполнения базовых операций SSE, приведено на диаграмме. В среднем наблюдается двукратное увеличение производительности.
Интересные новшества касаются уменьшения уровня потребления мощности и увеличения показателя «производительность на ватт». В связи с этим Intel представила две новые технологии: Deep Power Down Technology и Enhanced Dynamic Acceleration Technology. Технология Deep Power Down Technology будет внедрена, в первую очередь, в процессоры для мобильных платформ (Mobile Penryn). Для понижения энергопотребления в режиме бездействия добавлено еще одно особое состояние процессора, именуемое как Deep Power Down Technology State, или C6. В этом режиме предусмотрено отключение ядер, при этом также полностью отключается кэш-память. Это позволяет существенно понизить напряжение ядра и потребляемой мощности, что, в свою очередь, увеличивает время работы батареи.
Интересным нововведением является технология Enhanced Dynamic Acceleration Technology (EDAT). Её идея состоит в следующем. Для простоты возьмем случай с двухъядерным процессором. Поскольку в однопоточных приложениях от многоядерности толку мало, основную роль здесь играет производительность отдельно взятого ядра. Поэтому Intel предусмотрела увеличение частоты работающего ядра (non-idle core), в то время как второе (idle core) находится в одном из состояний бездействия (C3-C6) и его тепловыделение резко сокращается. Эту разницу использует работающее ядро и повышает свою частоту до достижения процессором граничного уровня TDP. Для наглядности приводим следующую иллюстрацию.
Теперь об уровне TDP 45-нм процессоров. К сожалению, пока нет данных о тепловыделении мобильных чипов. Двухъядерные Penryn для настольных ПК попадут в энергетический класс 65 Вт, а для их четырехъядерных родственников предусмотрены тепловые пакеты 95 и 130 Вт. В серверном сегменте для двухъядерных Intel Xeon уровни TDP составят 40, 65 и 80 Вт, а для четырехъядерных – 50, 80 и 120 Вт. Согласно внутренним тестам Intel, в игровых приложениях наблюдается 20-ти процентный прирост производительности новых чипов, а в операциях с декодированием видео (при условии использования SSE4) – более 40% прирост. Если сравнивать серверный процессор Penryn с частотой более 3 ГГц и самый мощный четырехъядерный Xeon (Xeon X5355, 2,66 ГГц, FSB 1333 МГц), прирост в приложениях, интенсивно использующих операции с плавающей запятой и чувствительных к пропускной способности, составит около 45%.

Стр.2 - Процессоры Nehalem

Подробнее о процессорах Nehalem

Ранее, в прессе проскальзывали упоминания о процессорах микроархитектуры Nehalem, но большинство сведений до сих пор носит неофициальный характер. Недавно представители Intel подтвердили информацию, что процессоры Nehalem будут включать до восьми ядер, при этом отдельные источники сообщают, что все ядра будут размещаться на одном кристалле, хотя, возможно, это будет реализовано лишь в 32-нм чипах микроархитектуры Nehalem. Микроархитектура Nehalem будет поддерживать технологию Simultaneous Multi-Treading (SMT), которая фактически является возрождением знаменитой Hyper-Threading (HT). Также в виде слухов проскальзывали сведения о так называемой технологии MTT (Multi-Threading Technology). Впрочем, какое бы название ни было, суть одна – в процессорах Nehalem компания Intel намерена использовать разделение каждого ядра на два логических (виртуальных) процессора. Таким образом, в случае 8-ми ядерного процессора можно организовать одновременную обработку до 16-ти потоков. В новых процессорах планируется использовать концепцию многоуровневого разделяемого кэша. При этом Патрик Гелсингер отмечает, что разделяемым будет только кэш высшего уровня. Также упоминается о технологии Enhanced Dynamic Power Management, связанной с улучшениями показателя «производительность на ватт», хотя подробных сведений о ней пока нет.
Из уст представителей Intel прозвучала информация о планах внедрения в CPU интегрированного контроллера памяти (IMC). Пока не уточняется, какие типы памяти будут поддерживаться IMC, но с учетом времени появления процессоров Nehalem (вторая половина 2008 года) логично предположить о поддержке DDR3. Говорится о замене FSB последовательной скоростной шиной типа Serial Point-to-point Interconnect (вероятнее всего, речь идет о CSI, Common Systems Interconnect). Подтверждается информация о намерении представить модели со встроенным GPU. Впрочем, все выше приведенные сведения вряд ли можно назвать неожиданными, важно было найти подтверждение слухов и догадок на официальном уровне.
По слухам, на базе чипов с микроархитектурой Nehalem будут представлены платформы, известные под кодовыми именами Stoutland и Thurley. В платформе Stoutland предусмотрена передача данных по шине CSI со скоростью от 4,8 до 6,4 гигатранзакций в секунду. В рамках этой платформы упоминается чипсет Boxboro с 72 линиями шины PCI Express 2.0. Платформа Thurley будет поддерживать 42 линии шины PCI Express. В систему можно будет установить до 96 Гб системной памяти. Сетевые возможности будут определяться Ethernet-контроллером с пропускной способностью 10 Гбит/с.

Послесловие

Если массовые поставки процессоров Penryn – реальность ближайших дней, то для чипов Nehalem пока существует некоторая неопределенность со сроками – говорится о начале производства в 2008 году. По слухам, первые небольшие партии новых чипов появятся во второй половине 2008 (вероятнее, ближе к концу года), а массовое производство начнется в 2009 году.
По последним данным пионерами 45-нм производства станут заводы D1D (штат Орегон, США) и Fab 32 (штат Аризона, США). Позже, в впервой половине 2008 года, к этим фабрикам подключится Fab 28, которая сейчас строится в городе Кирьят-Гат (Израиль). Кроме постройки новых фабрик Intel также намерена переоборудовать существующие. Например, в планах значится переоснащение Fab 11X в Рио Ранчо, штат Нью-Мексико, на которой впервые в отрасли было налажено производство кристаллов на 300-мм подложках. Первые 45-нм чипы здесь начнут выпускать во второй половине 2008 года. Судя по срокам начала производства, можно ожидать, что эта фабрика станет одной из главных по производству процессоров Nehalem. Впереди нас ожидает множество новых слухов и фактов о 45-нм процессорах компании Intel. В настоящее время компании IBM и AMD также активно работают над 45-нм техпроцессом, так что интриг и словесных перепалок на эту тему между фанатами AMD и Intel не избежать никак. А нам остается ждать новых интересных сведений от официальных представителей компаний.



Оригинал материала: https://3dnews.ru./263855