Серия GeForce 900 - GeForce 900 series

GeForce 900 серии
	Nvidia GeForce GTX 980 Ti Founders Edition
Дата выхода	18 сентября 2014 г . ; 6 лет назад
Кодовое название	GM20x
Архитектура	Максвелл
Модели	Серия GeForce
Транзисторы	2.94B (GM206)
Процесс изготовления	TSMC 28 нм
Карты
Средний диапазон
Высокого класса
Энтузиаст
Поддержка API
Direct3D	Direct3D 12 ( уровень функций 12_1)
OpenCL	OpenCL 3.0
OpenGL	OpenGL 4.6
Вулкан	Вулкан 1.2 ; СПИР-В
История
Предшественник
Преемник	GeForce 10 серии

Серия GeForce 900 - это семейство графических процессоров, разработанное Nvidia , пришедшее на смену серии GeForce 700 и служащее высококлассным введением в микроархитектуру Maxwell , названную в честь Джеймса Клерка Максвелла . Они производятся с TSMC «с 28 нм процесса.

С Maxwell, преемником Kepler , Nvidia ожидала трех основных результатов: улучшенные графические возможности, упрощенное программирование и лучшая энергоэффективность по сравнению с сериями GeForce 700 и GeForce 600 .

Maxwell был анонсирован в сентябре 2010 года, а первые продукты потребительского класса GeForce на базе Maxwell были выпущены в начале 2014 года.

Архитектура

Максвелл первого поколения (GM10x)

Первое поколение Maxwell GM107 / GM108 было выпущено как GeForce GTX 745, GTX 750/750 Ti и GTX 850M / 860M (GM107) и GT 830M / 840M (GM108). Эти новые чипы предоставляют несколько дополнительных функций, ориентированных на потребителя; Вместо этого Nvidia сосредоточилась на энергоэффективности. Nvidia увеличила объем кэша L2 с 256 КБ на GK107 до 2 МБ на GM107, уменьшив необходимую пропускную способность памяти. Соответственно, Nvidia сократила шину памяти со 192 бит на GK106 до 128 бит на GM107, что еще больше снизило энергопотребление. Nvidia также изменила дизайн потокового мультипроцессора по сравнению с Kepler (SMX), назвав его SMM. Структура планировщика деформации унаследована от Kepler, что позволяет каждому планировщику выдавать до двух инструкций, независимых друг от друга и соответствующих одной и той же деформации. Компоновка модулей SMM разделена так, что каждый из 4 планировщиков деформации в SMM управляет 1 набором из 32 ядер FP32 CUDA, 1 набором из 8 модулей загрузки / сохранения и 1 набором из 8 модулей специальных функций. Это отличается от Kepler, где каждый SMX имеет 4 планировщика, которые планируют для общего пула из 6 наборов из 32 ядер FP32 CUDA, 2 набора из 16 модулей загрузки / сохранения и 2 набора из 16 модулей специальных функций. Эти блоки соединены перекладиной, которая использует питание для совместного использования ресурсов. Эта перекладина убрана в Максвелле. Текстурные блоки и ядра FP64 CUDA по-прежнему используются совместно. SMM позволяет более детально распределять ресурсы, чем SMX, экономя электроэнергию, когда рабочая нагрузка не оптимальна для общих ресурсов. Nvidia утверждает, что SMM со 128 ядрами CUDA имеет 86% производительности SMX со 192 ядрами CUDA. Кроме того, каждый кластер обработки графики, или GPC, содержит до 4 модулей SMX в Kepler и до 5 модулей SMM в Maxwell первого поколения.

GM107 поддерживает CUDA Compute Capability 5.0 по сравнению с 3.5 на графических процессорах GK110 / GK208 и 3.0 на графических процессорах GK10x. Динамический параллелизм и HyperQ, две функции графических процессоров GK110 / GK208, также поддерживаются всей линейкой продуктов Maxwell.

Maxwell предоставляет собственные атомарные операции с общей памятью для 32-битных целых чисел и собственную 32-битную и 64-битную разделяемую память с функцией сравнения и замены (CAS), которые можно использовать для реализации других атомарных функций.

Хотя когда-то считалось, что Максвелл использует растеризацию в режиме немедленного режима на основе тайлов , Nvidia исправила это на GDC 2017, заявив, что Максвелл вместо этого использует тайловое кэширование.

NVENC

Графические процессоры на базе Maxwell также содержат SIP-блок NVENC, представленный в Kepler. Видеокодер Nvidia, NVENC, в 1,5–2 раза быстрее, чем на графических процессорах на базе Kepler, что означает, что он может кодировать видео со скоростью воспроизведения в 6–8 раз.

PureVideo

Nvidia также заявляет о 8-10-кратном увеличении производительности декодирования видео PureVideo Feature Set E за счет кеша видеодекодера в сочетании с повышением эффективности памяти. Однако H.265 не поддерживается для полного аппаратного декодирования, полагаясь на сочетание аппаратного и программного декодирования. При декодировании видео на графических процессорах Maxwell используется новое состояние низкого энергопотребления «GC5» для экономии энергии.

Максвелл второго поколения (GM20x)

Второе поколение Maxwell представило несколько новых технологий: Dynamic Super Resolution, Delta Color Compression третьего поколения, Multi-Pixel Programming Sampling, Nvidia VXGI (Real-Time-Voxel- Global Illumination ), VR Direct, Multi-Projection Acceleration и Multi-Frame Sampled. Сглаживание (MFAA) (однако поддержка сглаживания выборки покрытия (CSAA) была удалена). Также была добавлена поддержка HDMI 2.0.

Второе поколение Maxwell также изменило соотношение ROP к контроллеру памяти с 8: 1 до 16: 1. Однако некоторые из ROP обычно простаивают в GTX 970, потому что недостаточно активных SMM, чтобы дать им работу, и, следовательно, снижает его максимальную скорость заполнения.

Maxwell второго поколения также имеет до 4 модулей SMM на GPC, по сравнению с 5 модулями SMM на GPC.

GM204 поддерживает CUDA Compute Capability 5.2 по сравнению с 5.0 на графических процессорах GM107 / GM108, 3.5 на графических процессорах GK110 / GK208 и 3.0 на графических процессорах GK10x.

Графические процессоры Maxwell GM20x второго поколения имеют обновленный NVENC, который поддерживает кодирование HEVC и добавляет поддержку разрешений кодирования H.264 при 1440p / 60FPS и 4K / 60FPS по сравнению с NVENC на графических процессорах Maxwell GM10x первого поколения, которые поддерживали только кодирование H.264 1080p / 60FPS.

Графический процессор Maxwell GM206 поддерживает аппаратное декодирование HEVC с полной фиксированной функцией.

Рекламный спор

Технические характеристики оборудования GTX 970

Проблемы со спецификациями GeForce GTX 970 впервые были затронуты пользователями, когда они обнаружили, что карты, хотя и имеют 4 ГБ памяти, редко обращаются к памяти за пределом 3,5 ГБ. Дальнейшее тестирование и расследование в конечном итоге привели к тому, что Nvidia опубликовала заявление о том, что изначально заявленные характеристики карты были изменены без предварительного уведомления до того, как карта стала коммерчески доступной, и что карта потеряла производительность после того, как была введена в эксплуатацию память, превышающая предел в 3,5 ГБ.

Технические характеристики внутреннего оборудования карты, изначально заявленные как идентичные таковым у GeForce GTX 980, различались объемом кэш-памяти второго уровня (1,75 МБ против 2 МБ в GeForce GTX 980) и количеством ROP (56 против 64 в 980). Кроме того, было обнаружено, что карта была разработана для доступа к своей памяти в виде раздела 3,5 ГБ плюс 0,5 ГБ, причем доступ к последнему в 7 раз медленнее, чем к первому. Затем компания пообещала внести конкретную модификацию драйвера, чтобы облегчить проблемы с производительностью, вызванные сокращениями производительности карты. Однако позже Nvidia пояснила, что это обещание было неверным и не будет специального обновления драйверов для GTX 970. Nvidia заявила, что поможет клиентам, которые хотят получить возмещение, в их получении. 26 февраля 2015 года генеральный директор Nvidia Джен-Хсун Хуанг сделал запись в официальном блоге Nvidia, чтобы извиниться за инцидент. В феврале 2015 года против Nvidia и Gigabyte Technology был подан коллективный иск по обвинению в ложной рекламе в Окружной суд Северной Калифорнии.

Nvidia показала, что может отключать отдельные блоки, каждый из которых содержит 256 КБ кеш-памяти L2 и 8 ROP, без отключения всех контроллеров памяти. Это происходит за счет разделения шины памяти на высокоскоростные и низкоскоростные сегменты, к которым невозможно получить доступ одновременно, если один сегмент не читает, а другой сегмент записывает, потому что блок L2 / ROP, управляющий обоими контроллерами GDDR5, совместно использует канал возврата чтения и шина данных записи между двумя контроллерами GDDR5 и самим собой. Это используется в GeForce GTX 970, которая, следовательно, может быть описана как имеющая 3,5 ГБ в высокоскоростном сегменте на 224-битной шине и 0,5 ГБ в низкоскоростном сегменте на 32-битной шине.

27 июля 2016 года Nvidia согласилась на предварительное урегулирование коллективного иска в США, предложив возмещение в размере 30 долларов США за покупку GTX 970. Согласованная сумма возмещения представляет собой часть стоимости хранилища и производительности, которую потребители предполагали получить при покупке карты.

Поддержка асинхронных вычислений

В то время как серия Maxwell продавалась как полностью совместимая с DirectX 12, Oxide Games, разработчик Ashes of the Singularity , обнаружила, что карты на базе Maxwell не работают хорошо при использовании асинхронных вычислений.

Похоже, что хотя эта основная функция фактически предоставляется драйвером, Nvidia частично реализовала ее с помощью прокладки на основе драйвера, что привело к высокой производительности. В отличие от конкурирующих видеокарт AMD на базе GCN, которые включают полную реализацию аппаратных асинхронных вычислений, Nvidia планировала полагаться на драйвер для реализации программной очереди и на дистрибьютора программного обеспечения для пересылки асинхронных задач аппаратным планировщикам, способным распределять рабочую нагрузку. к правильным единицам. Поэтому для асинхронных вычислений на Maxwell требуется, чтобы и игра, и драйвер графического процессора были специально закодированы для асинхронных вычислений на Maxwell, чтобы включить эту возможность. Тест 3DMark Time Spy не показывает заметной разницы в производительности между включением и отключением асинхронных вычислений. Асинхронные вычисления отключены драйвером Maxwell.

Оксид утверждает, что это привело к тому, что Nvidia заставила их вообще не включать функцию асинхронных вычислений в свой тест, чтобы серия 900 не была в невыгодном положении по сравнению с продуктами AMD, которые реализуют асинхронные вычисления на оборудовании.

Maxwell требует, чтобы графический процессор был статически разделен для асинхронных вычислений, чтобы задачи могли выполняться одновременно. Каждому разделу назначается аппаратная очередь. Если какая-либо из очередей, назначенных разделу, пуста или не может отправить работу по какой-либо причине (например, задача в очереди должна быть отложена до устранения опасности ), раздел и все ресурсы в этом разделе зарезервированы для этой очереди будет бездействовать. Следовательно, асинхронные вычисления могут легко снизить производительность Maxwell, если они не созданы для работы со статическим планировщиком Maxwell. Кроме того, графические задачи загружают графические процессоры Nvidia намного легче, чем графические процессоры AMD на основе GCN, которые гораздо более ориентированы на вычисления, поэтому графические процессоры Nvidia имеют меньше дыр в планировании, которые могут быть заполнены асинхронными вычислениями, чем AMD. По этим причинам драйвер заставляет графический процессор Maxwell помещать все задачи в одну очередь и выполнять каждую задачу последовательно и предоставлять каждой задаче неразделенные ресурсы графического процессора, независимо от того, может ли каждая задача перегружать графический процессор или нет.

Продукты

GeForce 900 (9xx) серия

Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млрд)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Тактовые частоты			Наполняемость		объем памяти					Поддержка API (версия)				Вычислительная мощность (GFLOPS)		TDP (Вт)	Поддержка SLI	Стартовая цена (долл. США)
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млрд)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Базовая частота ядра ( МГц )	Повышение частоты ядра ( МГц )	Память ( МТ / с )	Пиксель ( GP / s)	Текстура ( GT / s)	Размер ( МБ )	Пропускная способность ( ГБ / с)	Тип	Ширина шины ( бит )	Размер кэша L2 ( МБ )	DirectX	OpenGL	OpenCL	Вулкан	Одинарная точность	Двойная точность	TDP (Вт)	Поддержка SLI	Стартовая цена (долл. США)
GeForce GTX 950	20 августа 2015 г.	GM206	TSMC 28 нм	2,94	227	PCIe 3.0 x16	768: 48: 32	1024	1188	6610	32,7	49,2	2048 4096	106	GDDR5	128	1	12,0 (12_1)	4.6	3.0	1.2	1572	49,1	90	2 пути	159 долларов США
GeForce GTX 950 (OEM)	2016 г.						1024: 64: 32	935	1203	5010	38,5	76,99	4096	80,19								1915 г.	76,99	Неизвестный	N / A	OEM
GeForce GTX 960	22 января 2015 г.						1024: 64: 32	1127	1178	7010	39,3	72,1	2048 4096	112								2308	72,1	120	2 пути	199 долларов США
GeForce GTX 960 (OEM)	6 ноября 2015 г.	GM204		5.2	398		1280: 80: 48	924 1176	N / A 1201	5010 7010	44,4 38,4	73,9 76,9	3072 4096	120 112		192 128	1,5 1					2365 2460	73,9 76,8	Неизвестный	2 пути	OEM
GeForce GTX 970	18 сентября 2014 г.						1664: 104: 56	1050	1178	7010	54,6	109,2	3584 + 512	196 + 28		224 + 32	1,75					3494	109	145	3-ходовой	329 долл. США
GeForce GTX 980	18 сентября 2014 г.						2048: 128: 64	1126	1216		72,1	144	4096	224		256	2					4612	144	165	4-ходовой	549 долл. США
GeForce GTX 980 Ti	2 июня 2015 г.	GM200		8.0	601		2816: 176: 96	1000	1076		96	176	6144	336		384	3					5632	176	250		649 долл. США
GeForce GTX Titan X	17 марта 2015 г.	GM200		8.0	601		3072: 192: 96	1000	1089		96	192	12288	336		384	3					6144	192	250		999 долл. США
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млрд)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Тактовые частоты			Наполняемость		объем памяти					Поддержка API (версия)				Вычислительная мощность (GFLOPS)		TDP (Вт)	Поддержка SLI	Стартовая цена (долл. США)
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млрд)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Базовая частота ядра ( МГц )	Повышение частоты ядра ( МГц )	Память ( МТ / с )	Пиксель ( GP / s)	Текстура ( GT / s)	Размер ( МБ )	Пропускная способность ( ГБ / с)	Тип	Ширина шины ( бит )	Размер кэша L2 ( МБ )	DirectX	OpenGL	OpenCL	Вулкан	Одинарная точность	Двойная точность	TDP (Вт)	Поддержка SLI	Стартовая цена (долл. США)

Серия GeForce 900M (9xxM)

Некоторые реализации могут использовать разные спецификации.

Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млн)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Тактовые частоты			Наполняемость		объем памяти				Поддержка API (версия)				Вычислительная мощность (GFLOPS)		TDP (Вт)	Поддержка SLI
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млн)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Базовая частота ядра ( МГц )	Повышение частоты ядра ( МГц )	Память ( МТ / с )	Пиксель ( GP / s)	Текстура ( GT / s)	Размер ( МиБ )	Пропускная способность ( ГБ / с)	Тип	Ширина шины ( бит )	DirectX	OpenGL	OpenCL	Вулкан	Одинарная точность	Двойная точность	TDP (Вт)	Поддержка SLI
GeForce 910M	18 августа 2015 г.	GF117	28 год	585	116	PCIe 3.0 x8	96: 16: 8	775	1550	1800	3.1	12,4	1024	14,4	DDR3	64	12,0 (11_0)	4.6	1.1	N / A	297,6	1/12 SP	33	Нет
GeForce 910M	15 марта 2015 г.	GK208		Неизвестный	87		384: 16: 8	575	575		5,13	9.2	2048						1.2	1.1	441,6	18,4
GeForce 920M	13 марта 2015 г.	GF117		585	116		96: 16: 8	775	1550		3.1	12,4	1024						1.1	N / A	297,6	1/12 SP
GeForce 920M	13 марта 2015 г.	GK208		Неизвестный	87		384: 32: 16	954	954		7,6	30,5	2048						1.2	1.1	732,7	22,9
GeForce 920MX	Март 2016 г.	GM108		1870 г.	148		256: 24: 8	1072	1176		8,58	25,7	2048		DDR3 GDDR5						549	1/32 SP	16
GeForce 930M	13 марта 2015 г.			1870 г.	148		384: 24: 8	928	941		7,4	22,3	2048		DDR3						712,7	22,3	33
GeForce 930MX	1 марта 2016 г.			Неизвестный	Неизвестный	PCIe 3.0 x8	Неизвестный	952	1020	2000 г.	Неизвестный	Неизвестный	2048	Неизвестный	DDR3 GDDR5	Неизвестный			Неизвестный	Неизвестный	Неизвестный	Неизвестный	Неизвестный	Неизвестный
GeForce 940M	13 марта 2015 г.	GM107		1870 г.	148	PCIe 3.0 x16	640: 40: 16	1029	1100	2002 г.	16,5	41,2	2048	16 - 80,2	GDDR5 DDR3	128			1.2	1.1	1317	41,1	75	Нет
GeForce 940M	13 марта 2015 г.	GM108		Неизвестный	Неизвестный	PCIe 3.0 x8	384: 24: 8	1029	1100		8,2	16,5	2048	16 - 80,2		64					790,3	24,7	33
GeForce 940MX	10 марта 2016 г.	GM108		1870 г.	148	PCIe 3.0 x8	384: 24: 8	1122	1242		8,98	26,93	2048 4096	16,02 (DDR3) 40,1 (GDDR5)		64					861,7	Неизвестный	23
GeForce 945M	2015 г.	GM107		1870 г.	148	?	640: 40: 16	1029	1085	?	16,46	41,2	?	?	DDR3 GDDR5	128					1,317,1	?	75	?
GeForce 945M	2015 г.	GM108		?	?	PCIe 3.0 x8	384: 24: 8	1122	1242	?	8,98	26,93	?	?	DDR3 GDDR5	64					861,7	?	23	?
GeForce GT 945A	13 марта 2015 г.	GM108		Неизвестный	Неизвестный	PCIe 3.0 x8	384: 24: 8	1072	1176	1800	8,58	25,73	2048	14,4	DDR3	64				Неизвестный	Неизвестный	Неизвестный	33	Неизвестный
GeForce GTX 950M	13 марта 2015 г.	GM107		1870 г.	148	PCIe 3.0 x16	640: 40: 16	914	1085	5012	14,6	36,6	2048 (GDDR5) 4096 (DDR3)	80 (GDDR5) 32 (DDR3)	DDR3 GDDR5	128			1.2	1.1	1170	36,56	75	Нет
GeForce GTX 960M	13 марта 2015 г.	GM107		1870 г.	148		640: 40: 16	1029	1085	5012	16,5	41,2	2048 4096	80	GDDR5						1317	41,16	65	Нет
GeForce GTX 965M	5 января 2015 г.	GM204		5200	398		1024: 64: 32	924	950	5000	30,2	60,4	2048 4096	80			12,0 (12_1)				1945 г.	60,78	60	да
GeForce GTX 970M	7 октября 2014 г.						1280: 80: 48	924	993	5012	37,0	73,9	3072 6144	120		192					2365	73,9	75
GeForce GTX 980M	7 октября 2014 г.						1536: 96: 64	1038	1127	5012	49,8	99,6	4096 8192	160		256					3189	99,6	100
GeForce GTX 980 (ноутбук)	22 сентября 2015 г.						2048: 128: 64	1064	1216	7010	72,1	144	4096 8192	224		256					4612	144	145
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млн)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Тактовые частоты			Наполняемость		объем памяти				Поддержка API (версия)				Вычислительная мощность (GFLOPS)		TDP (Вт)	Поддержка SLI
Модель	Запуск	Кодовое название	Fab ( нм )	Транзисторы (млн)	Размер матрицы (мм ² )	Интерфейс шины	Основная конфигурация	Базовая частота ядра ( МГц )	Повышение частоты ядра ( МГц )	Память ( МТ / с )	Пиксель ( GP / s)	Текстура ( GT / s)	Размер ( МиБ )	Пропускная способность ( ГБ / с)	Тип	Ширина шины ( бит )	DirectX	OpenGL	OpenCL	Вулкан	Одинарная точность	Двойная точность	TDP (Вт)	Поддержка SLI

Таблица наборов микросхем

Прекращенная поддержка

«Драйвер 368.81 - последний драйвер, поддерживающий 64-разрядную версию Windows XP / Windows XP» .

32-разрядная версия Windows XP : 368.81 загрузка драйвера
64-разрядная версия Windows XP : 368.81 загрузка драйвера

Nvidia объявила, что после выпуска драйверов 390 она больше не будет выпускать 32-разрядные драйверы для 32-разрядных операционных систем.

Графические процессоры для ноутбуков, основанные на архитектуре Kepler, перешли на поддержку устаревших версий в апреле 2019 года и перестали получать критические обновления безопасности после апреля 2020 года. Это изменение затронуло графические процессоры Nvidia GeForce 910M и 920M из семейства 9xxM.

Nvidia объявила, что после выпуска драйверов 470 она переведет поддержку драйверов для операционных систем Windows 7 и Windows 8.1 в устаревший статус и продолжит предоставлять критические обновления безопасности для этих операционных систем до сентября 2024 года.

Languages

In other projects