Xenos (графический чип) - Xenos (graphics chip)

Графический процессор Xbox 360

В Xenos является пользовательским блоком обработки графики (GPU) , разработанного ATI (теперь перешли в руках AMD ), используемой в Xbox 360 игровой консоли , разработанной и произведенной для Microsoft . Разработанный под кодовым названием «C1», он во многом связан с архитектурой R520 и, следовательно, очень похож на графические карты ATI Radeon X1800 XT для ПК по функциям и производительности. Однако Xenos представил новые дизайнерские идеи, которые позже были приняты в микроархитектуре TeraScale , такие как унифицированная шейдерная архитектура . Пакет содержит два отдельных кристалла , графический процессор и eDRAM (производства NEC ), в которых всего 337 миллионов транзисторов.

Характеристики

Чип основан на микроархитектуре TeraScale , шейдерные блоки организованы в три группы SIMD по 16 процессоров в группе, всего 48 процессоров. Каждый из этих процессоров состоит из пяти векторных блоков (всего 5 FP32 ALU ), что дает 240 блоков, которые могут последовательно выполнять до двух инструкций за цикл (умножение и сложение). Все процессоры в группе SIMD выполняют одну и ту же инструкцию, поэтому в общей сложности одновременно может выполняться до трех потоков инструкций.

  • Родительский графический процессор 500 МГц на 90 нм , 65 нм (с 2008 г.) процесс TSMC или 45-нм процесс GlobalFoundries (с 2010 г., с ЦП на одном кристалле) всего 232 миллиона транзисторов
    • 48 векторных блоков векторных процессоров с плавающей запятой для выполнения шейдеров , разделенных на три динамически планируемых группы SIMD по 16 процессоров в каждой.
      • Унифицированная архитектура затенения (каждый конвейер может запускать пиксельные или вершинные шейдеры )
      • 10 операций FP на векторный процессор за цикл (5 слитных операций умножения и сложения)
      • Максимальное количество вершин : 1,21 миллиарда вершин в секунду (48 шейдерных векторных процессоров × 2 операций в цикле × 500 МГц) / 8 векторных операций на вершину) для простых преобразованных и освещенных многоугольников.
      • Максимальное количество полигонов : ~ 500 миллионов полигонов в секунду
      • Максимальное количество шейдерных операций: 48 миллиардов шейдерных операций в секунду (3 шейдерных конвейера × 16 процессоров × 2 ALU × 500 МГц)
      • 240 ГФЛОПС
      • Функция шейдера MEMEXPORT
    • 16 блоков текстурной фильтрации (TF) и 16 блоков текстурной адресации (TA)
      • 16 отфильтрованных отсчетов за такт
        • Максимальная скорость заполнения пикселей: 4,00 GPixel / s
        • Максимальная текселя закраски: 8 гигатекселов в секунду (16 текстур × 500 МГц)
      • 16 нефильтрованных образцов текстуры за такт
    • Максимальное количество операций скалярного произведения : 24 миллиарда в секунду
    • Поддержка расширенного набора DirectX 9.0c API DirectX Xbox 360 и Shader Model 3.0+
  • 500 МГц, 10 Мб память встроенной DRAM (в 256Gbit / с) фреймбуфером на 90 нм , 80 нм (с 2008 года) или 65нм (с 2010 года).
    • Разработанный NEC кристалл eDRAM включает дополнительную логику (192 параллельных пиксельных процессора) для цвета, альфа-композитинга , альфа-смешивания, Z / буферизации трафарета и сглаживания, называемого «Интеллектуальная память», что дает разработчикам 4-образное сглаживание при очень небольших затратах на производительность. .
    • Технология процедурного синтеза (XPS): во время потоковой передачи чтения в ЦП пользовательская инструкция предварительной выборки, касание блока расширенного кэша данных (xDCBT) выполняет предварительную выборку данных непосредственно в кэш данных L1 предполагаемого ядра, которое пропускает помещение данных в кэш L2 для Избегайте перегрузки кэша L2. Потоковая запись из каждого ядра пропускает кэш L1 из-за его распределения без записи (позволяет избежать перегрузки высокоскоростных, переходных потоков данных только для записи в кеш L1) и направляется непосредственно в кэш L2. Система позволяет графическому процессору напрямую считывать данные, производимые процессором, без обращения к основной памяти. В этом конкретном случае потоковой передачи данных, называемом процедурным синтезом Xbox (XPS), ЦП фактически выполняет функцию распаковщика данных, генерируя геометрию на лету для использования трехмерным ядром графического процессора.
    • 105 миллионов транзисторов
    • 8 модулей вывода рендеринга
      • Максимальная скорость заполнения пикселей : 16 гигасэмплов в секунду при использовании 4-кратного мультисэмплового сглаживания (MSAA) или 32 гигасэмпла при использовании операции Z-only; 4 гигапикселя в секунду без MSAA (8 ROP × 500 МГц)
      • Максимальная частота дискретизации Z: 8 гигасэмплов в секунду (2 отсчета Z × 8 ROP × 500 МГц), 32 гигасэмпла в секунду с использованием 4-кратного сглаживания (2 отсчета Z × 8 ROP × 4X AA × 500 МГц)
      • Максимальная частота дискретизации сглаживания: 16 гигасэмплов в секунду (4 отсчета AA × 8 ROP × 500 МГц)
      • Поддержка билинейной, трилинейной, анизотропной фильтрации, Alpha to Coverage, аппаратной тесселяции и Predicated Tiling.
  • Охлаждение : И GPU, и CPU консоли имеют радиаторы . Радиатор графического процессора использует технологию тепловых трубок для отвода тепла от графического процессора и кристалла eDRAM к ребрам радиатора. Радиаторы активно охлаждаются парой вытяжных вентиляторов диаметром 60 мм. Новый модернизированный набор микросхем XCGPU присутствует как в Xbox 360 S, так и в Xbox 360 E и объединяет ЦП ( Xenon ) и графический процессор (Xenos) в одном корпусе и активно охлаждается одним радиатором, а не двумя.

Смотрите также

использованная литература