Серия GeForce 900 - GeForce 900 series

GeForce 900 серии
Логотип серии GTX 900 со слоганом.pngGTX980tiFE.jpg
Nvidia GeForce GTX 980 Ti Founders Edition
Дата выхода 18 сентября 2014 г . ; 6 лет назад ( 18 сентября 2014 г. )
Кодовое название GM20x
Архитектура Максвелл
Модели Серия GeForce
Транзисторы 2.94B (GM206)
Процесс изготовления TSMC 28 нм
Карты
Средний диапазон
Высокого класса
Энтузиаст
Поддержка API
Direct3D Direct3D 12 ( уровень функций 12_1)
OpenCL OpenCL 3.0
OpenGL OpenGL 4.6
Вулкан Вулкан 1.2
СПИР-В
История
Предшественник
Преемник GeForce 10 серии

Серия GeForce 900 - это семейство графических процессоров, разработанное Nvidia , пришедшее на смену серии GeForce 700 и служащее высококлассным введением в микроархитектуру Maxwell , названную в честь Джеймса Клерка Максвелла . Они производятся с TSMC «с 28 нм процесса.

С Maxwell, преемником Kepler , Nvidia ожидала трех основных результатов: улучшенные графические возможности, упрощенное программирование и лучшая энергоэффективность по сравнению с сериями GeForce 700 и GeForce 600 .

Maxwell был анонсирован в сентябре 2010 года, а первые продукты потребительского класса GeForce на базе Maxwell были выпущены в начале 2014 года.

Архитектура

Максвелл первого поколения (GM10x)

Первое поколение Maxwell GM107 / GM108 было выпущено как GeForce GTX 745, GTX 750/750 Ti и GTX 850M / 860M (GM107) и GT 830M / 840M (GM108). Эти новые чипы предоставляют несколько дополнительных функций, ориентированных на потребителя; Вместо этого Nvidia сосредоточилась на энергоэффективности. Nvidia увеличила объем кэша L2 с 256 КБ на GK107 до 2 МБ на GM107, уменьшив необходимую пропускную способность памяти. Соответственно, Nvidia сократила шину памяти со 192 бит на GK106 до 128 бит на GM107, что еще больше снизило энергопотребление. Nvidia также изменила дизайн потокового мультипроцессора по сравнению с Kepler (SMX), назвав его SMM. Структура планировщика деформации унаследована от Kepler, что позволяет каждому планировщику выдавать до двух инструкций, независимых друг от друга и соответствующих одной и той же деформации. Компоновка модулей SMM разделена так, что каждый из 4 планировщиков деформации в SMM управляет 1 набором из 32 ядер FP32 CUDA, 1 набором из 8 модулей загрузки / сохранения и 1 набором из 8 модулей специальных функций. Это отличается от Kepler, где каждый SMX имеет 4 планировщика, которые планируют для общего пула из 6 наборов из 32 ядер FP32 CUDA, 2 набора из 16 модулей загрузки / сохранения и 2 набора из 16 модулей специальных функций. Эти блоки соединены перекладиной, которая использует питание для совместного использования ресурсов. Эта перекладина убрана в Максвелле. Текстурные блоки и ядра FP64 CUDA по-прежнему используются совместно. SMM позволяет более детально распределять ресурсы, чем SMX, экономя электроэнергию, когда рабочая нагрузка не оптимальна для общих ресурсов. Nvidia утверждает, что SMM со 128 ядрами CUDA имеет 86% производительности SMX со 192 ядрами CUDA. Кроме того, каждый кластер обработки графики, или GPC, содержит до 4 модулей SMX в Kepler и до 5 модулей SMM в Maxwell первого поколения.

GM107 поддерживает CUDA Compute Capability 5.0 по сравнению с 3.5 на графических процессорах GK110 / GK208 и 3.0 на графических процессорах GK10x. Динамический параллелизм и HyperQ, две функции графических процессоров GK110 / GK208, также поддерживаются всей линейкой продуктов Maxwell.

Maxwell предоставляет собственные атомарные операции с общей памятью для 32-битных целых чисел и собственную 32-битную и 64-битную разделяемую память с функцией сравнения и замены (CAS), которые можно использовать для реализации других атомарных функций.

Хотя когда-то считалось, что Максвелл использует растеризацию в режиме немедленного режима на основе тайлов , Nvidia исправила это на GDC 2017, заявив, что Максвелл вместо этого использует тайловое кэширование.

NVENC

Графические процессоры на базе Maxwell также содержат SIP-блок NVENC, представленный в Kepler. Видеокодер Nvidia, NVENC, в 1,5–2 раза быстрее, чем на графических процессорах на базе Kepler, что означает, что он может кодировать видео со скоростью воспроизведения в 6–8 раз.

PureVideo

Nvidia также заявляет о 8-10-кратном увеличении производительности декодирования видео PureVideo Feature Set E за счет кеша видеодекодера в сочетании с повышением эффективности памяти. Однако H.265 не поддерживается для полного аппаратного декодирования, полагаясь на сочетание аппаратного и программного декодирования. При декодировании видео на графических процессорах Maxwell используется новое состояние низкого энергопотребления «GC5» для экономии энергии.

Максвелл второго поколения (GM20x)

Второе поколение Maxwell представило несколько новых технологий: Dynamic Super Resolution, Delta Color Compression третьего поколения, Multi-Pixel Programming Sampling, Nvidia VXGI (Real-Time-Voxel- Global Illumination ), VR Direct, Multi-Projection Acceleration и Multi-Frame Sampled. Сглаживание (MFAA) (однако поддержка сглаживания выборки покрытия (CSAA) была удалена). Также была добавлена ​​поддержка HDMI 2.0.

Второе поколение Maxwell также изменило соотношение ROP к контроллеру памяти с 8: 1 до 16: 1. Однако некоторые из ROP обычно простаивают в GTX 970, потому что недостаточно активных SMM, чтобы дать им работу, и, следовательно, снижает его максимальную скорость заполнения.

Maxwell второго поколения также имеет до 4 модулей SMM на GPC, по сравнению с 5 модулями SMM на GPC.

GM204 поддерживает CUDA Compute Capability 5.2 по сравнению с 5.0 на графических процессорах GM107 / GM108, 3.5 на графических процессорах GK110 / GK208 и 3.0 на графических процессорах GK10x.

Графические процессоры Maxwell GM20x второго поколения имеют обновленный NVENC, который поддерживает кодирование HEVC и добавляет поддержку разрешений кодирования H.264 при 1440p / 60FPS и 4K / 60FPS по сравнению с NVENC на графических процессорах Maxwell GM10x первого поколения, которые поддерживали только кодирование H.264 1080p / 60FPS.

Графический процессор Maxwell GM206 поддерживает аппаратное декодирование HEVC с полной фиксированной функцией.

Рекламный спор

Технические характеристики оборудования GTX 970

Проблемы со спецификациями GeForce GTX 970 впервые были затронуты пользователями, когда они обнаружили, что карты, хотя и имеют 4 ГБ памяти, редко обращаются к памяти за пределом 3,5 ГБ. Дальнейшее тестирование и расследование в конечном итоге привели к тому, что Nvidia опубликовала заявление о том, что изначально заявленные характеристики карты были изменены без предварительного уведомления до того, как карта стала коммерчески доступной, и что карта потеряла производительность после того, как была введена в эксплуатацию память, превышающая предел в 3,5 ГБ.

Технические характеристики внутреннего оборудования карты, изначально заявленные как идентичные таковым у GeForce GTX 980, различались объемом кэш-памяти второго уровня (1,75 МБ против 2 МБ в GeForce GTX 980) и количеством ROP (56 против 64 в 980). Кроме того, было обнаружено, что карта была разработана для доступа к своей памяти в виде раздела 3,5 ГБ плюс 0,5 ГБ, причем доступ к последнему в 7 раз медленнее, чем к первому. Затем компания пообещала внести конкретную модификацию драйвера, чтобы облегчить проблемы с производительностью, вызванные сокращениями производительности карты. Однако позже Nvidia пояснила, что это обещание было неверным и не будет специального обновления драйверов для GTX 970. Nvidia заявила, что поможет клиентам, которые хотят получить возмещение, в их получении. 26 февраля 2015 года генеральный директор Nvidia Джен-Хсун Хуанг сделал запись в официальном блоге Nvidia, чтобы извиниться за инцидент. В феврале 2015 года против Nvidia и Gigabyte Technology был подан коллективный иск по обвинению в ложной рекламе в Окружной суд Северной Калифорнии.

Nvidia показала, что может отключать отдельные блоки, каждый из которых содержит 256 КБ кеш-памяти L2 и 8 ROP, без отключения всех контроллеров памяти. Это происходит за счет разделения шины памяти на высокоскоростные и низкоскоростные сегменты, к которым невозможно получить доступ одновременно, если один сегмент не читает, а другой сегмент записывает, потому что блок L2 / ROP, управляющий обоими контроллерами GDDR5, совместно использует канал возврата чтения и шина данных записи между двумя контроллерами GDDR5 и самим собой. Это используется в GeForce GTX 970, которая, следовательно, может быть описана как имеющая 3,5 ГБ в высокоскоростном сегменте на 224-битной шине и 0,5 ГБ в низкоскоростном сегменте на 32-битной шине.

27 июля 2016 года Nvidia согласилась на предварительное урегулирование коллективного иска в США, предложив возмещение в размере 30 долларов США за покупку GTX 970. Согласованная сумма возмещения представляет собой часть стоимости хранилища и производительности, которую потребители предполагали получить при покупке карты.

Поддержка асинхронных вычислений

В то время как серия Maxwell продавалась как полностью совместимая с DirectX 12, Oxide Games, разработчик Ashes of the Singularity , обнаружила, что карты на базе Maxwell не работают хорошо при использовании асинхронных вычислений.

Похоже, что хотя эта основная функция фактически предоставляется драйвером, Nvidia частично реализовала ее с помощью прокладки на основе драйвера, что привело к высокой производительности. В отличие от конкурирующих видеокарт AMD на базе GCN, которые включают полную реализацию аппаратных асинхронных вычислений, Nvidia планировала полагаться на драйвер для реализации программной очереди и на дистрибьютора программного обеспечения для пересылки асинхронных задач аппаратным планировщикам, способным распределять рабочую нагрузку. к правильным единицам. Поэтому для асинхронных вычислений на Maxwell требуется, чтобы и игра, и драйвер графического процессора были специально закодированы для асинхронных вычислений на Maxwell, чтобы включить эту возможность. Тест 3DMark Time Spy не показывает заметной разницы в производительности между включением и отключением асинхронных вычислений. Асинхронные вычисления отключены драйвером Maxwell.

Оксид утверждает, что это привело к тому, что Nvidia заставила их вообще не включать функцию асинхронных вычислений в свой тест, чтобы серия 900 не была в невыгодном положении по сравнению с продуктами AMD, которые реализуют асинхронные вычисления на оборудовании.

Maxwell требует, чтобы графический процессор был статически разделен для асинхронных вычислений, чтобы задачи могли выполняться одновременно. Каждому разделу назначается аппаратная очередь. Если какая-либо из очередей, назначенных разделу, пуста или не может отправить работу по какой-либо причине (например, задача в очереди должна быть отложена до устранения опасности ), раздел и все ресурсы в этом разделе зарезервированы для этой очереди будет бездействовать. Следовательно, асинхронные вычисления могут легко снизить производительность Maxwell, если они не созданы для работы со статическим планировщиком Maxwell. Кроме того, графические задачи загружают графические процессоры Nvidia намного легче, чем графические процессоры AMD на основе GCN, которые гораздо более ориентированы на вычисления, поэтому графические процессоры Nvidia имеют меньше дыр в планировании, которые могут быть заполнены асинхронными вычислениями, чем AMD. По этим причинам драйвер заставляет графический процессор Maxwell помещать все задачи в одну очередь и выполнять каждую задачу последовательно и предоставлять каждой задаче неразделенные ресурсы графического процессора, независимо от того, может ли каждая задача перегружать графический процессор или нет.

Продукты

GeForce 900 (9xx) серия

Модель Запуск Кодовое название Fab ( нм ) Транзисторы (млрд) Размер матрицы (мм 2 ) Интерфейс шины Основная конфигурация Тактовые частоты Наполняемость объем памяти Поддержка API (версия) Вычислительная мощность (GFLOPS) TDP (Вт) Поддержка SLI Стартовая цена (долл. США)
Базовая частота ядра ( МГц ) Повышение частоты ядра ( МГц ) Память ( МТ / с ) Пиксель ( GP / s) Текстура ( GT / s) Размер ( МБ ) Пропускная способность ( ГБ / с) Тип Ширина шины ( бит ) Размер кэша L2 ( МБ ) DirectX OpenGL OpenCL Вулкан Одинарная точность Двойная точность
GeForce GTX 950 20 августа 2015 г. GM206 TSMC 28 нм 2,94 227 PCIe 3.0 x16 768: 48: 32 1024 1188 6610 32,7 49,2 2048
4096
106 GDDR5 128 1 12,0 (12_1) 4.6 3.0 1.2 1572 49,1 90 2 пути 159 долларов США
GeForce GTX 950 (OEM) 2016 г. 1024: 64: 32 935 1203 5010 38,5 76,99 4096 80,19 1915 г. 76,99 Неизвестный N / A OEM
GeForce GTX 960 22 января 2015 г. 1127 1178 7010 39,3 72,1 2048
4096
112 2308 72,1 120 2 пути 199 долларов США
GeForce GTX 960 (OEM) 6 ноября 2015 г. GM204 5.2 398 1280: 80: 48 924
1176
N / A
1201
5010
7010
44,4
38,4
73,9
76,9
3072
4096
120
112
192
128
1,5
1
2365
2460
73,9
76,8
Неизвестный OEM
GeForce GTX 970 18 сентября 2014 г. 1664: 104: 56 1050 1178 7010 54,6 109,2 3584 + 512 196 + 28 224 + 32 1,75 3494 109 145 3-ходовой 329 долл. США
GeForce GTX 980 2048: 128: 64 1126 1216 72,1 144 4096 224 256 2 4612 144 165 4-ходовой 549 долл. США
GeForce GTX 980 Ti 2 июня 2015 г. GM200 8.0 601 2816: 176: 96 1000 1076 96 176 6144 336 384 3 5632 176 250 649 долл. США
GeForce GTX Titan X 17 марта 2015 г. 3072: 192: 96 1089 192 12288 6144 192 999 долл. США
Модель Запуск Кодовое название Fab ( нм ) Транзисторы (млрд) Размер матрицы (мм 2 ) Интерфейс шины Основная конфигурация Тактовые частоты Наполняемость объем памяти Поддержка API (версия) Вычислительная мощность (GFLOPS) TDP (Вт) Поддержка SLI Стартовая цена (долл. США)
Базовая частота ядра ( МГц ) Повышение частоты ядра ( МГц ) Память ( МТ / с ) Пиксель ( GP / s) Текстура ( GT / s) Размер ( МБ ) Пропускная способность ( ГБ / с) Тип Ширина шины ( бит ) Размер кэша L2 ( МБ ) DirectX OpenGL OpenCL Вулкан Одинарная точность Двойная точность

Серия GeForce 900M (9xxM)

Некоторые реализации могут использовать разные спецификации.

Модель Запуск Кодовое название Fab ( нм ) Транзисторы (млн) Размер матрицы (мм 2 ) Интерфейс шины Основная конфигурация Тактовые частоты Наполняемость объем памяти Поддержка API (версия) Вычислительная мощность (GFLOPS) TDP (Вт) Поддержка SLI
Базовая частота ядра ( МГц ) Повышение частоты ядра ( МГц ) Память ( МТ / с ) Пиксель ( GP / s) Текстура ( GT / s) Размер ( МиБ ) Пропускная способность ( ГБ / с) Тип Ширина шины ( бит ) DirectX OpenGL OpenCL Вулкан Одинарная точность Двойная точность
GeForce 910M 18 августа 2015 г. GF117 28 год 585 116 PCIe 3.0 x8 96: 16: 8 775 1550 1800 3.1 12,4 1024 14,4 DDR3 64 12,0 (11_0) 4.6 1.1 N / A 297,6 1/12 SP 33 Нет
15 марта 2015 г. GK208 Неизвестный 87 384: 16: 8 575 575 5,13 9.2 2048 1.2 1.1 441,6 18,4
GeForce 920M 13 марта 2015 г. GF117 585 116 96: 16: 8 775 1550 3.1 12,4 1024 1.1 N / A 297,6 1/12 SP
GK208 Неизвестный 87 384: 32: 16 954 954 7,6 30,5 2048 1.2 1.1 732,7 22,9
GeForce 920MX Март 2016 г. GM108 1870 г. 148 256: 24: 8 1072 1176 8,58 25,7 2048 DDR3 GDDR5 549 1/32 SP 16
GeForce 930M 13 марта 2015 г. 384: 24: 8 928 941 7,4 22,3 2048 DDR3 712,7 22,3 33
GeForce 930MX 1 марта 2016 г. Неизвестный Неизвестный PCIe 3.0 x8 Неизвестный 952 1020 2000 г. Неизвестный Неизвестный 2048 Неизвестный DDR3 GDDR5 Неизвестный Неизвестный Неизвестный Неизвестный Неизвестный Неизвестный Неизвестный
GeForce 940M 13 марта 2015 г. GM107 1870 г. 148 PCIe 3.0 x16 640: 40: 16 1029 1100 2002 г. 16,5 41,2 2048 16 - 80,2 GDDR5 DDR3 128 1.2 1.1 1317 41,1 75 Нет
GM108 Неизвестный Неизвестный PCIe 3.0 x8 384: 24: 8 8,2 16,5 64 790,3 24,7 33
GeForce 940MX 10 марта 2016 г. 1870 г. 148 384: 24: 8 1122 1242 8,98 26,93 2048
4096
16,02 (DDR3)
40,1 (GDDR5)
861,7 Неизвестный 23
GeForce 945M 2015 г. GM107 ? 640: 40: 16 1029 1085 ? 16,46 41,2 ? ? DDR3 GDDR5 128 1,317,1 ? 75 ?
GM108 ? ? PCIe 3.0 x8 384: 24: 8 1122 1242 8,98 26,93 64 861,7 23
GeForce GT 945A 13 марта 2015 г. Неизвестный Неизвестный 384: 24: 8 1072 1176 1800 8,58 25,73 2048 14,4 DDR3 Неизвестный Неизвестный Неизвестный 33 Неизвестный
GeForce GTX 950M 13 марта 2015 г. GM107 1870 г. 148 PCIe 3.0 x16 640: 40: 16 914 1085 5012 14,6 36,6 2048 (GDDR5)
4096 (DDR3)
80 (GDDR5)
32 (DDR3)
DDR3

GDDR5

128 1.2 1.1 1170 36,56 75 Нет
GeForce GTX 960M 640: 40: 16 1029 1085 16,5 41,2 2048
4096
80 GDDR5 1317 41,16 65
GeForce GTX 965M 5 января 2015 г. GM204 5200 398 1024: 64: 32 924 950 5000 30,2 60,4 12,0 (12_1) 1945 г. 60,78 60 да
GeForce GTX 970M 7 октября 2014 г. 1280: 80: 48 924 993 5012 37,0 73,9 3072
6144
120 192 2365 73,9 75
GeForce GTX 980M 1536: 96: 64 1038 1127 49,8 99,6 4096
8192
160 256 3189 99,6 100
GeForce GTX 980 (ноутбук) 22 сентября 2015 г. 2048: 128: 64 1064 1216 7010 72,1 144 224 256 4612 144 145
Модель Запуск Кодовое название Fab ( нм ) Транзисторы (млн) Размер матрицы (мм 2 ) Интерфейс шины Основная конфигурация Тактовые частоты Наполняемость объем памяти Поддержка API (версия) Вычислительная мощность (GFLOPS) TDP (Вт) Поддержка SLI
Базовая частота ядра ( МГц ) Повышение частоты ядра ( МГц ) Память ( МТ / с ) Пиксель ( GP / s) Текстура ( GT / s) Размер ( МиБ ) Пропускная способность ( ГБ / с) Тип Ширина шины ( бит ) DirectX OpenGL OpenCL Вулкан Одинарная точность Двойная точность

Таблица наборов микросхем

Прекращенная поддержка

«Драйвер 368.81 - последний драйвер, поддерживающий 64-разрядную версию Windows XP / Windows XP» .

Nvidia объявила, что после выпуска драйверов 390 она больше не будет выпускать 32-разрядные драйверы для 32-разрядных операционных систем.

Графические процессоры для ноутбуков, основанные на архитектуре Kepler, перешли на поддержку устаревших версий в апреле 2019 года и перестали получать критические обновления безопасности после апреля 2020 года. Это изменение затронуло графические процессоры Nvidia GeForce 910M и 920M из семейства 9xxM.

Nvidia объявила, что после выпуска драйверов 470 она переведет поддержку драйверов для операционных систем Windows 7 и Windows 8.1 в устаревший статус и продолжит предоставлять критические обновления безопасности для этих операционных систем до сентября 2024 года.

Смотрите также

использованная литература

внешние ссылки