Ксеон Пхи - Xeon Phi
Общая информация | |
---|---|
Запущен | 2010 г. |
Снято с производства | 2020 г. |
Представление | |
Максимум. Тактовая частота процессора | От 1,053 ГГц до 1,7 ГГц |
Кэш | |
Кэш L1 | 32 КБ на ядро |
Кэш L2 | 512 КБ на ядро |
Архитектура и классификация | |
Архитектура | x86-64 |
Расширения | |
Физические характеристики | |
Транзисторы | |
Ядра | |
Розетки) | |
Продукты, модели, варианты | |
Торговые марки) |
Xeon Phi - это серия многоядерных процессоров x86 , разработанных и изготовленных Intel . Он предназначен для использования в суперкомпьютерах, серверах и высокопроизводительных рабочих станциях. Его архитектура позволяет использовать стандартные языки программирования и интерфейсы прикладного программирования (API), такие как OpenMP .
Поскольку изначально он был основан на более ранней конструкции графического процессора ( под кодовым названием Larrabee ) от Intel, которая была отменена в 2009 году, он разделяет области приложений с графическими процессорами. Основное различие между Xeon Phi и GPGPU, таким как Nvidia Tesla, заключается в том, что Xeon Phi с x86-совместимым ядром может с меньшими изменениями запускать программное обеспечение, которое изначально предназначалось для стандартного процессора x86. Он был снят с производства из-за отсутствия спроса и проблем Intel с его 10-нм узлом.
Первоначально в виде дополнительных карт на базе PCIe в июне 2013 года был анонсирован продукт второго поколения под кодовым названием Knights Landing . Эти чипы второго поколения можно было использовать как автономный процессор, а не просто как надстройку. карта.
В июне 2013 года суперкомпьютер Tianhe-2 в Национальном суперкомпьютерном центре в Гуанчжоу (NSCC-GZ) был объявлен самым быстрым суперкомпьютером в мире (по состоянию на июнь 2018 года он занимает 4-е место). Он использовал сопроцессоры Intel Xeon Phi и процессоры Ivy Bridge -EP Xeon для достижения 33,86 петафлопс.
Линейка продуктов Xeon Phi напрямую конкурировал с Nvidia «s Tesla и AMD Radeon Instinct линий глубокого изучения и GPGPU карт.
История
Кодовое название | Технология | Комментарии |
---|---|---|
Рыцари Ферри | 45 нм | предлагается как карта PCIe; получено из проекта Larrabee |
Уголок Рыцарей | 22 морских миль | полученный из P54C; блок векторной обработки; первое устройство, которое будет объявлено как Xeon Phi |
Приземление рыцарей | 14 морских миль | получено из Silvermont / Airmont (Intel Atom); AVX-512 |
Рыцарская мельница | 14 морских миль | почти идентичен Knights Landing, но оптимизирован для глубокого обучения |
Knights Hill | 10 нм | отменен |
Фон
Микроархитектуры Лараби (в разработке с 2006 года) представил очень широкий (512 бит) SIMD устройства к х86 конструкции на основе архитектуры процессора, продолжается до кэша-когерентного мультипроцессорной системы , подключенной через кольцевую шину к памяти; каждое ядро было способно к четырехсторонней многопоточности. Из-за того, что дизайн предназначен для использования с графическим процессором, а также для вычислений общего назначения, чипы Larrabee также включают специализированное оборудование для выборки текстур. Проект по производству продукта для розничной продажи GPU непосредственно из исследовательского проекта Larrabee был прекращен в мае 2010 года.
Другим современным исследовательским проектом Intel, реализующим архитектуру x86 на многоядерном процессоре, был « Однокристальный облачный компьютер » (прототип представлен в 2009 г.), конструкция, имитирующая вычислительный центр обработки данных для облачных вычислений на одном кристалле с несколькими независимыми ядрами: дизайн прототипа включал 48 ядер на чип с аппаратной поддержкой выборочного управления частотой и напряжением ядер для максимального повышения энергоэффективности, а также встроенная ячеистая сеть для обмена сообщениями между чипами. В дизайне не хватало ядер, связанных с кешем, и он был сосредоточен на принципах, которые позволили бы масштабировать дизайн до гораздо большего числа ядер.
Терафлопс исследования Чип (прототип открыт в 2007 году) представляет собой экспериментальный 80-ядерный чип с двумя с плавающей точкой единиц на ядро, реализующих 96-битный VLIW архитектуру вместо архитектуры x86. В рамках проекта были исследованы методы межядерной связи, управление питанием на кристалле, и был достигнут результат 1,01 терафлопс на частоте 3,16 ГГц при потреблении 62 Вт энергии.
Рыцари Ферри
Прототип платы Intel Many Integrated Core (MIC) под названием Knights Ferry , включающий процессор под кодовым названием Aubrey Isle, был анонсирован 31 мая 2010 года. Было заявлено, что продукт является производным от проекта Larrabee и других исследований Intel, включая одночиповый облачный компьютер .
Продукт для разработки предлагался в виде карты PCIe с 32 упорядоченными ядрами с частотой до 1,2 ГГц с четырьмя потоками на ядро, 2 ГБ памяти GDDR5 и 8 МБ когерентной кэш-памяти L2 (256 КБ на ядро с 32 КБ кеш-памяти L1), а также потребляемая мощность ~ 300 Вт, построена по 45 нм техпроцессу. В ядре Aubrey Isle 1024-битная кольцевая шина (512-битная двунаправленная) соединяет процессоры с основной памятью. Одноплатная производительность превысила 750 GFLOPS. Платы-прототипы поддерживают только команды с плавающей запятой одинарной точности .
Первоначальными разработчиками были CERN , Корейский институт науки и технической информации (KISTI) и суперкомпьютерный центр Leibniz . В число поставщиков оборудования для прототипов плат входили IBM, SGI, HP, Dell и другие.
Уголок Рыцарей
Линия продуктов Knights Corner производится с размером процесса 22 нм с использованием технологии Intel Tri-gate с более чем 50 ядрами на чип и является первым многоядерным коммерческим продуктом Intel.
В июне 2011 года SGI объявила о партнерстве с Intel для использования архитектуры MIC в своих высокопроизводительных вычислительных продуктах. В сентябре 2011 года было объявлено, что Техасский центр передовых вычислений (TACC) будет использовать карты Knights Corner в своем суперкомпьютере Stampede на 10 петафлопс, обеспечивающем вычислительную мощность 8 петафлопс. Согласно «Stampede: комплексная петафлопсная вычислительная среда», «MIC второго поколения Intel (Knights Landing) будут добавлены, когда они станут доступны, увеличивая совокупную пиковую производительность Stampede как минимум до 15 петафлопс».
15 ноября 2011 года Intel представила первую кремниевую версию процессора Knights Corner.
5 июня 2012 года Intel выпустила программное обеспечение с открытым исходным кодом и документацию по Knights Corner.
18 июня 2012 года Intel объявила на Гамбургской международной конференции по суперкомпьютерам 2012 года, что Xeon Phi будет торговой маркой, используемой для всех продуктов, основанных на их архитектуре с множеством интегрированных ядер. В июне 2012 года Cray объявила, что предложит 22-нм чипы Knight's Corner (под торговой маркой Xeon Phi) в качестве сопроцессора в своих системах Cascade.
В июне 2012 года ScaleMP объявила об обновлении виртуализации, позволяющем Xeon Phi использовать в качестве прозрачного расширения процессора, позволяя запускать устаревший код MMX / SSE без изменений кода. Важным компонентом ядра сопроцессора Intel Xeon Phi является его векторный процессор (VPU). VPU имеет новый 512-битный набор инструкций SIMD, официально известный как Intel Initial Many Core Instructions (Intel IMCI). Таким образом, VPU может выполнять 16 операций с одинарной точностью (SP) или 8 операций с двойной точностью (DP) за цикл. VPU также поддерживает инструкции Fused Multiply-Add (FMA) и, следовательно, может выполнять 32 SP или 16 DP операций с плавающей запятой за цикл. Он также поддерживает целые числа. VPU также имеет расширенный математический модуль (EMU), который может выполнять такие операции, как обратное вычисление, извлечение квадратного корня и логарифм, что позволяет выполнять эти операции в векторном режиме с высокой пропускной способностью. EMU работает, вычисляя полиномиальные приближения этих функций.
12 ноября 2012 года Intel анонсировала два семейства сопроцессоров Xeon Phi с размером процесса 22 нм: Xeon Phi 3100 и Xeon Phi 5110P. Xeon Phi 3100 будет способен выполнять более 1 терафлопс инструкций с плавающей запятой двойной точности с пропускной способностью памяти 240 ГБ / с при мощности 300 Вт. Xeon Phi 5110P будет способен выполнять 1,01 терафлопс инструкций с плавающей запятой двойной точности с Пропускная способность памяти 320 ГБ / с при мощности 225 Вт. Xeon Phi 7120P будет способен выполнять 1,2 терафлопс инструкций с плавающей запятой двойной точности с пропускной способностью памяти 352 ГБ / с при 300 Вт.
17 июня 2013 года суперкомпьютер Tianhe-2 был объявлен TOP500 самым быстрым в мире. Tianhe-2 использовал процессоры Intel Ivy Bridge Xeon и Xeon Phi для достижения 33,86 петафлопс. Он был самым быстрым в списке за два с половиной года, последний раз в ноябре 2015 года.
Дизайн и программирование
Ядра Knights Corner основаны на модифицированной версии дизайна P54C , использовавшейся в оригинальном Pentium. В основе архитектуры Intel MIC лежит использование наследия x86 путем создания x86-совместимой многопроцессорной архитектуры, которая может использовать существующие программные инструменты распараллеливания. Инструменты программирования включают OpenMP , OpenCL , Cilk / Cilk Plus и специализированные версии Intel Fortran, C ++ и математические библиотеки.
Элементы дизайна, унаследованные от проекта Larrabee, включают x86 ISA, 4- сторонний SMT на ядро, 512-битные блоки SIMD, 32 КБ кеш-памяти L1, 32 КБ кеш-памяти L1, согласованный кэш L2 (512 КБ на ядро) и сверхширокий кольцевая шина, соединяющая процессоры и память.
512-битные инструкции SIMD Knights Corner разделяют многие внутренние функции с расширением AVX-512. Документация по набору команд доступна в Intel под названием расширения KNC.
- Модели Xeon Phi
X100 Series
Имя | Серийный номер |
Ядра ( потоки @ 4 ядра) |
Часы (МГц) | Кэш L2 |
Память GDDR5 ECC | Пиковое вычисление DP (GFLOPS) |
Расчетная мощность (Вт) |
Охлаждающая система |
Фактор формы | Выпущенный | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | каналы |
BW ГБ / с |
|||||||||
Xeon Phi 3110X | SE3110X | 61 (244) | 1053 | - | 30,5 МБ | 6 ГБ | 12 | 240 | 1028 | 300 | Голая доска | Карта PCIe 2.0 x16 | Ноябрь 2012 г. |
8 ГБ | 16 | 320 | |||||||||||
Xeon Phi 3120A | SC3120A | 57 (228) | 1100 | - | 28,5 МБ | 6 ГБ | 12 | 240 | 1003 | 300 | Вентилятор / радиатор | 17 июня 2013 г. | |
Xeon Phi 3120P | SC3120P | 57 (228) | 1100 | - | 28,5 МБ | 6 ГБ | 12 | 240 | 1003 | 300 | Пассивный радиатор | 17 июня 2013 г. | |
Xeon Phi 31S1P | BC31S1P | 57 (228) | 1100 | - | 28,5 МБ | 8 ГБ | 16 | 320 | 1003 | 270 | Пассивный радиатор | 17 июня 2013 г. | |
Xeon Phi 5110P | SC5110P | 60 (240) | 1053 | - | 30,0 МБ | 8 ГБ | 16 | 320 | 1011 | 225 | Пассивный радиатор | 12 ноя 2012 | |
Xeon Phi 5120D | SC5120D | 60 (240) | 1053 | - | 30,0 МБ | 8 ГБ | 16 | 352 | 1011 | 245 | Голая доска | 230-контактная карта SFF | 17 июня 2013 г. |
BC5120D | |||||||||||||
Xeon Phi SE10P | SE10P | 61 (244) | 1100 | - | 30,5 МБ | 8 ГБ | 16 | 352 | 1074 | 300 | Пассивный радиатор | Карта PCIe 2.0 x16 | 12 ноября 2012 г. |
Xeon Phi SE10X | SE10X | 61 (244) | 1100 | - | 30,5 МБ | 8 ГБ | 16 | 352 | 1074 | 300 | Голая доска | 12 ноября 2012 г. | |
Xeon Phi 7110P | SC7110P | 61 (244) | 1100 | 1250 | 30,5 МБ | 16 гигабайт | 16 | 352 | 1220 | 300 | Пассивный радиатор | ??? | |
Xeon Phi 7110X | SC7110X | 61 (244) | 1250 | ??? | 30,5 МБ | 16 гигабайт | 16 | 352 | 1220 | 300 | Голая доска | ??? | |
Xeon Phi 7120A | SC7120A | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 гигабайт | 16 | 352 | 1208 | 300 | Вентилятор / радиатор | 6 апреля 2014 г. | |
Xeon Phi 7120D | SC7120D | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 гигабайт | 16 | 352 | 1208 | 270 | Голая доска | 230-контактная карта SFF | Март ??, 2014 |
Xeon Phi 7120P | SC7120P | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 гигабайт | 16 | 352 | 1208 | 300 | Пассивный радиатор | Карта PCIe 2.0 x16 | 17 июня 2013 г. |
Xeon Phi 7120X | SC7120X | 61 (244) | 1238 | 1333 | 30,5 МБ | 16 гигабайт | 16 | 352 | 1208 | 300 | Голая доска | 17 июня 2013 г. |
Приземление рыцарей
Кодовое название продукта Intel с архитектурой MIC второго поколения. Корпорация Intel официально впервые раскрыла подробности о своих продуктах Intel Xeon Phi второго поколения 17 июня 2013 года. Intel заявила, что следующее поколение продуктов на базе архитектуры Intel MIC будет доступно в двух формах: сопроцессор или хост-процессор (ЦП), и производиться с использованием техпроцесса Intel 14 нм . Продукты Knights Landing будут включать встроенную память для значительно более высокой пропускной способности памяти.
Knights Landing содержит до 72 ядер Airmont (Atom) с четырьмя потоками на каждое ядро, используя сокет LGA 3647, поддерживающий до 384 ГБ «далекой» оперативной памяти DDR4 2133 и 8–16 ГБ встроенной «ближней» 3D MCDRAM , версии Гибридный куб памяти . Каждое ядро имеет два 512-битных векторных блока и поддерживает инструкции SIMD AVX-512 , в частности, основные инструкции Intel AVX-512 (AVX-512F) с инструкциями по обнаружению конфликтов Intel AVX-512 (AVX-512CD), экспоненциальные инструкции Intel AVX-512 и Взаимные инструкции (AVX-512ER) и инструкции предварительной выборки Intel AVX-512 (AVX-512PF). Поддержка IMCI была удалена в пользу AVX-512.
Национальный энергетический научно - исследовательский вычислительный центр объявил , что 2 - го этапа своей новейшей системы суперкомпьютеров «Cori» будет использовать Knights Landing Xeon Phi сопроцессоры.
20 июня 2016 года Intel представила семейство продуктов Intel Xeon Phi x200 на основе архитектуры Knights Landing, подчеркнув ее применимость не только к традиционным рабочим нагрузкам моделирования, но и к машинному обучению . Модельный ряд, анонсированный при запуске, включал только Xeon Phi загрузочного форм-фактора, но две его версии: стандартные процессоры и процессоры со встроенной архитектурой Intel Omni-Path . Последний обозначается суффиксом F в номере модели. Ожидается, что интегрированная матрица обеспечит лучшую задержку при меньших затратах, чем дискретные высокопроизводительные сетевые карты.
14 ноября 2016 года в 48-м списке ТОП500 было 10 систем, использующих платформы Knights Landing.
PCIe на базе сопроцессора вариант Landing Найта никогда не предлагал общий рынок и был прекращен в августе 2017. Это включало 7220A, 7240P и 7220P сопроцессор карту.
Intel объявила, что прекращает выпуск Knights Landing летом 2018 года.
- Модели
Все модели могут разгоняться до пиковых скоростей, добавляя 200 МГц к базовой частоте при работе всего лишь с одним или двумя ядрами. При работе от трех до максимального количества ядер микросхемы могут увеличивать частоту только на 100 МГц выше базовой. Все микросхемы запускают код высокого разрешения AVX с частотой, сниженной на 200 МГц.
Xeon Phi 7200 серии |
Номер sSpec |
Ядра (потоки) |
Часы (МГц) | Кэш L2 |
Память MCDRAM | Память DDR4 | Пиковое вычисление DP |
Расчетная мощность (Вт) |
Разъем | Дата выхода | номер части | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | BW | Емкость | BW | |||||||||
Xeon Phi 7210 | SR2ME (B0) | 64 (256) | 1300 | 1500 | 32 МБ | 16 гигабайт | 400+ ГБ / с | 384 ГБ | 102,4 ГБ / с | 2662 ГФЛОПС |
215 | SVLCLGA3647 | 20 июня 2016 г. | HJ8066702859300 |
SR2X4 (B0) | ||||||||||||||
Xeon Phi 7210F | SR2X5 (B0) | 230 | HJ8066702975000 | |||||||||||
Xeon Phi 7230 | SR2MF (B0) | 215 | HJ8066702859400 | |||||||||||
SR2X3 (B0) | ||||||||||||||
Xeon Phi 7230F | SR2X2 (B0) | 230 | HJ8066702269002 | |||||||||||
Xeon Phi 7250 | SR2MD (B0) | 68 (272) | 1400 | 1600 | 34 МБ | 3046 ГФЛОПС |
215 | HJ8066702859200 | ||||||
SR2X1 (B0) | ||||||||||||||
Xeon Phi 7250F | SR2X0 (B0) | 230 | HJ8066702268900 | |||||||||||
Xeon Phi 7290 | SR2WY (B0) | 72 (288) | 1500 | 1700 | 36 МБ | 3456 ГФЛОПС |
245 | HJ8066702974700 | ||||||
Xeon Phi 7290F | SR2WZ (B0) | 260 | HJ8066702975200 |
Knights Hill
Knights Hill - это кодовое название архитектуры MIC третьего поколения, первые подробности которой Intel объявила на SC14. Он должен был быть произведен по 10-нм техпроцессу.
Предполагалось, что Knights Hill будет использоваться в суперкомпьютере Aurora Министерства энергетики США , который будет развернут в Аргоннской национальной лаборатории . Однако Aurora была отложена в пользу использования «продвинутой архитектуры» с упором на машинное обучение.
В 2017 году Intel объявила об отмене Knights Hill в пользу другой архитектуры, построенной с нуля, чтобы обеспечить возможности вычислений Exascale в будущем. Ожидается, что эта новая архитектура выйдет на 2020–2021 годы.
Рыцарская мельница
Knights Mill - это кодовое название Intel для продукта Xeon Phi, специализирующегося на глубоком обучении , первоначально выпущенного в декабре 2017 года. Практически идентичный по спецификациям Knights Landing, Knights Mill включает оптимизацию для лучшего использования инструкций AVX-512 и поддерживает четырехстороннюю гиперпоточность . Повышена производительность с плавающей запятой одинарной и переменной точности за счет производительности с плавающей запятой двойной точности.
- Модели
Xeon Phi 72x5 серии |
sSpec номер | Ядра (потоки) |
Часы (МГц) | Кэш L2 |
Память MCDRAM | Память DDR4 | Пиковое вычисление DP |
Расчетная мощность (Вт) |
Разъем | Дата выхода | Номер части | |||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
База | Турбо | Количество | BW | Емкость | BW | |||||||||
Xeon Phi 7235 | SR3VF (A0) | 64 (256) | 1300 | 1400 | 32 МБ | 16 гигабайт | 400+ ГБ / с | 384 ГБ | 102,4 ГБ / с | TBA | 250 | SVLCLGA3647 | 4 квартал 2017 г. | HJ8068303823900 |
Xeon Phi 7285 | SR3VE (A0) | 68 (272) | 1300 | 1400 | 34 МБ | 115,2 ГБ / с | TBA | 250 | HJ8068303823800 | |||||
Xeon Phi 7295 | SR3VD (A0) | 72 (288) | 1500 | 1600 | 36 МБ | 115,2 ГБ / с | TBA | 320 | HJ8068303823700 |
Программирование
Исследователи провели эмпирическое исследование производительности и программируемости, в котором авторы утверждают, что для достижения высокой производительности с помощью Xeon Phi по-прежнему требуется помощь программистов и что простое использование компиляторов с традиционными моделями программирования все еще далеко от реальности. Однако исследования в различных областях, таких как науки о жизни и глубокое обучение, показали, что использование как потокового, так и SIMD-параллелизма Xeon Phi позволяет значительно ускорить работу.
Конкуренты
- Nvidia Tesla , прямой конкурент на рынке высокопроизводительных вычислений
- AMD Radeon Pro и AMD Radeon Instinct прямые конкуренты на рынке высокопроизводительных вычислений
Смотрите также
- Texas Advanced Computing Center - суперкомпьютер "Stampede" на базе чипов Xeon Phi. Паническое бегство может достигать 10 петафлопс.
- AVX-512
- Ячейка (микропроцессор)
- Intel Tera-Scale
- Массивно параллельный
- Xeon
использованная литература
внешние ссылки
- Страницы Intel: Процессоры Intel Xeon Phi