Флагманский представитель 40-й серии GeForce — RTX 4090 — занял место в ряду самых впечатляющих релизов NVIDIA наравне с такими легендами, как GeForce GTX 980 Ti и GTX 1080 Ti. Благодаря тому, что создатели архитектуры Ada поставили во главу угла энергоэффективность и вычислительную мощность GPU, RTX 4090 совершил настоящий прорыв в игровой производительности, опередив 90-ю модель прошлого поколения на 62–72 %. В большинстве тайтлов ему даже не требуется масштабирование кадров для того, чтобы получить фреймрейт выше 60 FPS в 4К с рейтрейсингом. А главное, отношение быстродействия к цене тоже двинулось вверх по сравнению со старшими представителями 30-й серии. Тем не менее даже при рекомендованной стоимости $1 599 без учета ажиотажных накруток (в этот раз наверняка кратковременных) GeForce RTX 4090 чрезвычайно дорог. Мы посоветовали не спешить с покупкой, ведь обычно топовые модели не самые выгодные. Но после знакомства с RTX 4080 складывается впечатление, что придется подождать еще немного.
#Технические характеристики, цены
В основе новых потребительских видеокарт NVIDIA лежит кремний Ada Lovelace, который производится силами тайваньской TSMC по техпроцессу 4N. Последний, вопреки названию, является разновидностью 5-нанометрового узла N5, заточенной специально под «зеленые» чипы. Тем не менее переход с нормы 8 нм, которой NVIDIA пользовалась ранее, обеспечил колоссальный рост плотности транзисторов и позволил создать такой графический процессор, как AD102 — его компонентный бюджет составляет ни много ни мало 76,3 млрд транзисторов. Именно на масштабе, а также высоких тактовых частотах зиждется производительность чипов Ada, ведь по сравнению с Ampere архитектура «зеленых» GPU не претерпела больших структурных изменений. Можно подчеркнуть лишь увеличенную пропускную способность блоков рейтрейсинга, тензорных ядер и возможность кодирования видео AV1 силами выделенного ASIC. В остальном Ada является продуктом экстенсивного развития — настолько, что инженеры NVIDIA пренебрегли двумя ожидаемыми функциями: поддержкой PCI Express пятого поколения и выходами DisplayPort 2.0.
Как бы то ни было, если судить по достижениям флагманского GeForce RTX 4090, вклад в чистую производительность GPU окупился сполна. Однако побочным эффектом чрезвычайно высокой вычислительной мощности стало то, что даже передовые десктопные CPU не в состоянии раскрыть потенциал RTX 4090 в любых режимах, кроме игры на 4К-экране (и лучше еще и с трассировкой лучей). Решение проблемы было найдено в алгоритме DLSS версии 3.0, который не только масштабирует кадры, прошедшие полный конвейер рендеринга, но и генерирует промежуточные при помощи оптического потока — специально для этого блок Optical Flow в чипах Ada был усилен, а с GPU прошлого поколения (по крайней мере формально) DLSS 3.0 не совместим.
Ключевые признаки и некоторые другие, не столь заметные нововведения архитектуры Ada Lovelace мы обсуждали подробно в обзоре GeForce RTX 4090. Сегодня же сосредоточимся на характеристиках и производительности второй по старшинству модели серии, GeForce RTX 4080.
Производитель
NVIDIA
Название
AD104
AD103
AD102
Где используется
Н/Д
GeForce RTX 4080
GeForce RTX 4090
Микроархитектура
Ada Lovelace
Ada Lovelace
Ada Lovelace
Техпроцесс, нм
5 нм (4N)
5 нм (4N)
5 нм (4N)
Число транзисторов, млрд
35,8
45,9
76,3
Площадь чипа, мм2
295
378,6
608,6
Число SM/TPC/GPC
Streaming Multiprocessors (SM)
60
84
144
Thread Processing Clusters (TPC)
30
42
72
Graphics Processing Clusters (GPC)
5
7
12
Конфигурация потокового мультипроцессора (SM)
CUDA-ядра FP16
Нет
Нет
Нет
CUDA-ядра FP32
4 32
4 32
4 32
CUDA-ядра FP64
2
2
2
CUDA-ядра INT32
4 16
4 16
4 16
ALU специального назначения (SFU)
4 4
4 4
4 4
Тензорные ядра
4 1
4 1
4 1
RT-ядра
1
1
1
Блоки наложения текстур (TMU)
4
4
4
Объем регистрового файла, Кбайт
256
256
256
Объем кеша L1/разделяемой памяти, Кбайт
128
128
128
Программируемые вычислительные блоки GPU
CUDA-ядра FP16
Нет
Нет
Нет
CUDA-ядра FP32
7 680
10 752
18 432
CUDA-ядра FP64
120
168
288
CUDA-ядра INT32
3 840
5 376
9 216
ALU специального назначения (SFU)
960
1 344
2 304
Тензорные ядра
240
336
576
RT-ядра
60
84
144
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU)
240
336
576
Блоки операций растеризации (ROP)
80
112
192
Конфигурация памяти
Объем кеша L2, Мбайт
48
64
96
Разрядность шины RAM, бит
192
256
384
Тип микросхем RAM
GDDR6X SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
Интерфейс NVLINK
Нет
Нет
Нет
Интерфейс PCI Express
4.0 x16
4.0 x16
4.0 x16
В отличие от 30-й серии, вся верхушка которой укомплектована кристаллами GA102, 80-я и 90-е позиции нового поколения опираются на разные графические процессоры: AD102 и AD103 соответственно. Чип второго эшелона содержит всего лишь 62 % компонентного бюджета AD102 — 45,9 млрд транзисторов, что, тем не менее, на 62 % больше, чем у крупнейшего чипа Ampere — GA102. При этом AD103 полностью копирует формулу основных вычислительных блоков GA102: 84 потоковых мультипроцессора и, соответственно, 10 752 CUDA-ядра стандартной точности, а также 256 блоков наложения текстур и 112 блоков операций растеризации. Значительная часть дополнительных транзисторов ушла на массивный кеш второго уровня, объем которого в AD103 составляет 64 Мбайт. Таким образом создатели Ada уменьшили требования к пропускной способности VRAM — в результате AD103 довольствуется нехарактерно узкой для мощных видеокарт 256-битной шиной памяти.
В GeForce RTX 4080 не используется полностью функциональный кристалл AD103: чип урезали на 8 SM, оставив в распоряжении пользователя 9 728 CUDA-ядер FP32, 304 текстурных блока и 112 ROP. Таким образом, по формуле GPU новинка оказалась в промежутке между GeForce RTX 3080 и RTX 3080 Ti, однако благодаря чрезвычайно высоким тактовым частотам (консервативный парамтр Boost Clock составляет 2 505 МГц) по теоретической вычислительной мощности RTX 4080 превосходит не только RTX 3080 (на 64 %), но и даже RTX 3090 Ti (на 34 %).
Локальная память GeForce RTX 4080 набрана микросхемами GDDR6X с номиналом 22,4 Гбит/с (выше, чем 21 Гбит/с у GeForce RTX 4090) но в связи с узкой 256-битной шиной общая пропускная способность VRAM оказалась даже ниже, чем у GeForce RTX 3080, — что и должен компенсировать большой кеш второго уровня. Объем памяти, напротив, составляет достаточные всем современным играм и многим рабочим задачам 16 Гбайт.
Производитель
NVIDIA
Модель
GeForce RTX 3080
GeForce RTX 3080 Ti
GeForce RTX 3090 Ti
GeForce RTX 4080
GeForce RTX 4090
Графический процессор
Название
GA102
GA102
GA102
AD103
AD102
Микроархитектура
Ampere
Ampere
Ampere
Ada Lovelace
Ada Lovelace
Техпроцесс
8 нм (8N)
8 нм (8N)
8 нм (8N)
5 нм (4N)
5 нм (4N)
Число транзисторов, млрд
28 300
28,3
28,3
45,9
76,3
Тактовая частота, МГц: Base Clock / Boost Clock
1 440/1 710
1 365/1 665
1 395/1 695
2 210/2 505
2 230/2 520
Шейдерные ALU FP32
8 704
10 240
10 752
9 728
16 384
Блоки наложения текстур (TMU)
272
320
336
304
512
Блоки операций растеризации (ROP)
96
112
112
112
176
Тензорные ядра
272
320
336
304
512
RT-ядра
68
80
84
76
128
Оперативная память
Разрядность шины, бит
320
384
384
256
384
Тип микросхем
GDDR6X SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)
1 188 (19 000)
1 188 (19 000)
1 313 (21 000)
1 400 (22 400)
1 313 (21 000)
Объем, Мбайт
10 240
12 288
24 576
16 384
24 576
Объем кеша L2, Мбайт
6
6
6
64
96
Шина ввода/вывода
PCI Express 4.0 x16
PCI Express 4.0 x16
PCI Express 4.0 x16
PCI Express 4.0 x16
PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)
29 768
34 099
36 449
48 737
82 575
Производительность FP64/FP32
1/32
1/32
1/32
1/32
1/32
Производительность FP16/FP32
1/1
1/1
1/1
1/1
1/1
Пропускная способность оперативной памяти, Гбайт/с
760
912
1 008
717
1 008
Вывод изображения
Интерфейсы вывода изображения
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт
320
350
450
320
450
Розничная цена (США, без налога), $
699 (рекоменд. в момент выхода)
1 199 (рекоменд. в момент выхода)
1 999 (рекоменд. в момент выхода)
1 199 (рекоменд. в момент выхода)
1599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.
63 490 (рекоменд. в момент выхода)
116 900 (рекоменд. в момент выхода)
Н/Д
Н/Д
Н/Д
80-е модели 30-го и 40-го семейства рассчитаны на одинаковую потребляемую мощность в пределах 320 Вт, при том что GeForce RTX 3090 Ti и GeForce RTX 4090 расходуют вплоть до 450 Вт. Как следствие, GeForce RTX 4080 не только сулит большую абсолютную производительность, чем любая видеокарта прошлого поколения, но и в то же время превосходит их по быстродействию на ватт. А вот преимущество новинки в игровых FPS на доллар стоимости под сомнением, ведь несмотря на то, что RTX 4080 основан на GPU второго эшелона, ему назначили такую же рекомендованную цену, как RTX 3080 Ti, — $1 199, а RTX 3080 и вовсе намеревались продавать за $699. Конечно, большую часть своего жизненного цикла ускорители 30-й серии не были доступны по MSRP из-за повышенного спроса и дефицита полупроводников, но получается, что теперь NVIDIA возвела цену кризисного периода в норму, а для геймерской 80-й модели это более чувствительное изменение, чем для просьюмерского ускорителя RTX 4090.
Что касается российского рынка, то на старте продаж…
Подробнее на https://7ooo.ru/group/2022/11/21/917-obzor-videokarty-nvidia-geforce-rtx-4080-shag-vpered-i-dva-nazad-grss-155812473.html
Присоединяйтесь — мы покажем вам много интересного
Присоединяйтесь к ОК, чтобы подписаться на группу и комментировать публикации.
Нет комментариев