GeForce 8000: DirectX 10 и универсальные шейдеры
GeForce 9000
GeForce 200
GeForce 400: DirectX 11 и тесселяция
GeForce 500
GeForce 600
GeForce 700
GeForce 8000: DirectX 10 и универсальные шейдеры
В ноябре 2006 года были выпущены первые видеокарты новой 8000 серии — GeForce 8800GTS и 8800GTX. Их сердцем стал чип G80, первенец новой архитектуры Tesla с поддержкой DirectX 10 и шейдеров версии 4.0.
Графическая архитектура была кардинально переработана. G80 состоит из восьми вычислительных блоков, именуемых кластерами текстурной обработки (TPC). Внутри TPC два потоковых мультипроцессора (SM), в каждом из которых два TMU и восемь универсальных скалярных шейдерных процессоров (SP). Равномерно распределяет работу между блоками диспетчер потоков Thread Engine. Помимо работы с графикой, поддерживаются расчеты с помощью нового API СUDA, разработанного NVIDIA.
Растровые блоки сгруппированы по четыре, и привязаны к 64-битному контроллеру памяти. У G80 шесть таких контроллеров. Таким образом, он обладает 384-битной шиной памяти, 24 ROP, 32 TMU и 128 SP. Для сравнения: в современном флагмане RTX4090 - 16384 SP, ровно в 128 раз больше. Шейдерные процессоры в новой архитектуре работают на собственной частоте. Она более чем вдвое превышает частоту ядра и масштабируется вместе с ней. Флагманская карта получила 768 МБ памяти GDDR3 с пропускной способностью 86 ГБ/c.
G80 обеспечивал качественную анизотропную фильтрацию с меньшим штрафом производительности, и поддерживал новые режимы сглаживания — MSAA 8x и CSAA. Тепловыделение чипа достигло 150 Вт. Для запаса по разгону модели оснащались двумя разъемами дополнительного питания 6-pin. Появилась поддержка 3-Way SLI, позволяющего объединить три новые карты в тандем.
В апреле 2007 года выпущено еще два чипа для младших карт серии. Первый — G84 с 32 SP, ставший основой серии GeForce 8600. Второй — G86 с 16 SP, предназначенный для карт 8500GT и 8400GS. Серия GeForce 8600 оснащалась двумя видами памяти: GDDR3 и DDR2. Более бюджетные карты использовали только DDR2. Обе линейки карт имели 256 или 512 МБ памяти.
Карты на флагманском G80 опережали конкурирующую серию Radeon HD 2900, но были очень дороги. G84 был лишь четвертинкой от старшего чипа, и не мог обеспечить хорошей скорости в DirectX 10. Серии требовались не слишком дорогие, но производительные карты, которые стали бы массовыми. В недрах NVIDIA уже кипела разработка еще одного чипа, который решил эту проблему. Встречайте — G92.
В основу G92 лег чип G80 с переносом на 65 нм техпроцесс и серией доработок. Конфигурация памяти была упрощена: осталось четыре 64-битных контроллера из шести. Таким образом, количество ROP сократилось до 16, а шина памяти стала 256-битной. Количество TMU было увеличено до 64 штук. G92 получил поддержку шины PCI-E 2.0, которая удваивает скорость «общения» карты с системой.
Первая модель 8800GT на основе нового ГП, слегка урезанного по блокам, была выпущена в октябре 2007 года. Спустя два месяца увидела свет 8800GTS 512 на полной версии чипа G92. Новые карты пользовались популярностью за счет высокой производительности: первая приближалась к 8800GTX, а вторая часто обгоняла ее. В январе 2008 года успешный чип лег в основу новой младшей карты серии 8800 — 8800GS.
GeForce 9000
GeForce 8800 на чипе G92 имели большой успех, но разрыв в производительности между ними и «середнячками» GeForce 8600 был очень большим. Эту ошибку исправила первая карта новой серии — GeForce 9600GT, основой которой стал чип G94. В его арсенале 16 ROP и 256-битная шина памяти, как и у G92, но вдвое меньшее количество SP и TMU. Невысокая цена вкупе с хорошей производительностью сделали карту не менее популярной, чем ее предшественники высокого класса.
Среди одночиповых решений NVIDIA лидировала, и ей некуда было торопиться. Конкурирующая серия Radeon HD3800 была медленнее, но выпуск двухчиповой 3870X2 в январе 2008 года подорвал позиции лидера. Поэтому в марте была представлена первая двухчиповая карта на архитектуре Tesla — 9800GX2. По сути, модель представляла собой пару объединенных 8800GTS 512 с пониженными частотами. Tепловыделение такого «бутерброда» составило 197 Вт.
Позже чип G92 стал основой карт других карт серии GeForce 9800, а также модели 9600GSO. ГП G94 лег в основу 9600GSO 512 и 9600GS. Основная часть моделей имела 512 МБ или 1 ГБ памяти GDDR3, а модели со 192-битной шиной — 768 МБ.
Для бюджетного сегмента был выпущен новый чип G96, представляющий собой «половинку» от G94 со 128-битной шиной памяти. Он использовался в моделях 9500GT и 9400GT, у которых встречались варианты как c памятью GDDR3, так и с DDR2.
В конце 2008 года NVIDIA перенесла удачные чипы G92 и G94 на более тонкий техпроцесс 55 нм. Обновленные версии заменили старые чипы в картах линеек GeForce 9600 и 9800, снизив их энергопотребление.
GeForce 200
В июне 2008 года, параллельно с расширением графической линейки GeForce 9000, NVIDIA представляет флагманские видеокарты следующего поколения — GTX260 и GTX280.
Чип GT200, используемый в картах, основан на архитектуре Tesla с некоторыми доработками. Шейдерным процессорам добавлена возможность одновременного исполнения двух инструкций, а части из них — поддержка вычислений FP64. ГП получил ускоренный темп работы с геометрическими шейдерами и увеличенное количество одновременно обрабатываемых потоков. Алгоритмы сжатия памяти стали более эффективными.
Строение чипа претерпело некоторые изменения. Теперь в каждом TPC не два, а три SM. Количество TPC увеличено с 8 до 10, вследствие чего полный чип имеет 32 ROP, 80 TMU и 240 SP. Восемь 64-битных контроллеров составляют 512-битную шину памяти GDDR3, которая в топовой карте имела пропускную способность свыше 140 ГБ/c. GT200 был крайне горяч и прожорлив, умудряясь потреблять до 236 Вт. Для его питания понадобилась комбинация из двух коннекторов — 6-pin и 8-pin.
ATI Radeon серии HD4000 были куда успешнее предшественников. Старшая HD4870 могла конкурировать с GTX260 при меньшем энергопотреблении, а двухчиповая HD4870X2 не оставляла камня на камне от GTX280 в играх, оптимизированных под CrossFire.
В конце 2008 года NVIDIA перенесла GT200 на техпроцесс 55 нм, тем самым немного остудив его горячий нрав. Эта версия нашла применение в обновленных моделях GTX260 216, GTX 275, GTX285, а также GTX295 — нового двухчипового короля графики, ставшего ответом на HD4870X2. Все карты на чипе GT200, за исключением GTX280 и GTX285 с 1ГБ, обладают нестандартным объемом памяти 896 МБ — это следствие урезанной до 448 бит шины памяти.
В 2009 году была представлена GTS250 на базе чипа G92, уже знакомого по предыдущим сериям. На моделях бюджетного ценового сегмента NVIDIA решила обкатать технологию производства 40 нм, выпустив три новых ГП: GT215, GT216 и GT218. Они получили слегка доработанную версию архитектуры Tesla с поддержкой DirectX 10.1 и шейдерной модели 4.1. Карты выпускались в двух вариантах — с 512 МБ и 1 ГБ памяти.
Старший чип GT215 с 96 SP лег в основу модели GT240, которая первой из карт компании получила версию с памятью GDDR5. Средний GT126 с 48 SP использовался в модели GT220. Оба чипа получили 128-битную шину памяти, в отличие от младшего ГП GT218 с шиной 64 бит. Он использовался в картах GeForce 205 и 210, и имеет всего 16 SP.
GeForce 400: DirectX 11 и тесселяция
Первые карты серии GeForce 400 с поддержкой DirectX 11, основными новшествами которого являются поддержка тесселяции и вычислений DirectCompute, были представлены в марте 2010 года. В их основу легла новая архитектура Fermi и уже обкатанный техпроцесс 40 нм. Конкуренты в этот раз выпустили новые карты быстрее — линейка Radeon HD5000 появилась на рынке на полгода раньше.
Дебютной новинкой стала карта GTX480 на чипе GF100. Он состоит из четырех вычислительных графических кластеров (GPC). В каждом из них находятся по четыре SM. Один SM содержит 32 SP и блок Polymorph Engine, предназначенный для работы тесселяции.
Полный GF100 имеет 48 ROP, 64 TMU и 512 SP. Шина имеет ширину в 384 бита, а в качестве памяти используется 1.5 ГБ GDDR5 с полосой пропускания 177 ГБ/c. Чип был очень сложным, трудно было добиться малого количества брака. Поэтому в топовой GTX480 использовалась урезанная версия GF100, TDP которого даже в таком виде достигло 250 Вт. ГП поддерживает технологию 4-way SLI, которая позволяет объединить силы сразу четырех карт.
Модель GTX470 вдобавок к еще более урезанному чипу получила меньшую ширину шины — 320 бит, из-за чего объем памяти составил нетипичные 1280 МБ. Младшая GTX465 получила 1ГБ 256-битной памяти, и растеряла львиную долю SP — их осталось всего две трети.
Карты на GF100 опережали предыдущее поколение до полутора раз, но стоили недешево, требовали мощного питания и хорошего охлаждения. В июле 2010 года была представлена GTX460: карта среднего ценового сегмента, получившая популярность. В ее основе чип GF104, получивший 384 SP и 256-битную шину. Он получил улучшения TMU, позволяющие обрабатывать текстуры FP16 вдвое быстрее.
GTX 460 имела две разновидности: с полной 256-битной шиной и урезанной до 192 бит. В первом случае объем памяти составил 1 ГБ, во втором — 768 МБ. Чип был немного урезан по блокам в обеих картах, но больше всего — в появившейся позже GTX460 SE.
По чистой производительности GeForce 400 были сравнимы с серией Radeon HD5000, но значительно опережали их при использовании тесселяции — соответствующий блок у карт ATI был слабее.
Осень 2010 года принесла с собой бюджетные новинки. Чип GF106 — половина от полного GF104, стал основой GTS450. Она имеет 1 ГБ 128-битной GDDR3 или GDDR5, хотя ГП поддерживает 192-битный интерфейс памяти.
GT440 получила две разновидности. Первая основана на урезанном по блокам GF106, но со 192-битной памятью GDDR3. Вторая — на чипе GF108, младшем в линейке. Он содержит всего 96 SP и обладает 128-битной шиной. Помимо GT440, этот же чип использует младшая GT430.
GeForce 500
Линейка GeForce 500 представляет собой обновление GeForce 400, и использует ту же архитектуру Fermi. Прирост производительности в этом поколении небольшой.
Чип GF110 пришел на смену GF100, повторяя его по устройству и количеству различных блоков. ГП получил удвоенный темп обработки текстур формата FP16, аналогично GF104 из прошлой линейки. К тому же, он научился более эффективно отбрасывать полигоны, невидимые в кадре. Благодаря отлаженному производству удалось повысить частоты и сохранить все блоки чипа активными во флагмане GTX580. Совокупность изменений ускорила карту на 15–20% по сравнению c GTX480.
GTX580 увидела свет в ноябре 2010 года. Как и предшественник, карта оснащалась 1.5 ГБ 384-битной GDDR5, хотя позже появились и варианты с 3 ГБ. Пропускная способность памяти возросла до 192 ГБ/c. GTX570 основана на том же чипе, но с частью отключенных блоков. Шину памяти урезали до 320 бит, а объем — до 1280 или 2560 МБ. Позже на основе еще более урезанного чипа были выпущены две модели GTX 560 Ti, отличающиеся различным количеством активных SP.
В январе 2011 года на сцену выходит GTX560 Ti на основе ГП GF114, являющегося ближайшим родственником GF104. Как и в случае с GTX580, старшая карта теперь имеет полный чип. Память 256-битная, аналогично предшественнику. Позже в продажу поступили GTX560 и GTX560SE, обладающие меньшим количеством активных SP, но сохранившие полную шину. Объем памяти всех моделей линейки — 1 или 2 ГБ.
Двухчиповая Radeon HD5970 конкурента в прошлом поколении осталась без ответа. В марте AMD, которая уже перестала использовать в названиях карт бренд ATI, запускает следующую «двухголовую» карту HD6990. На этот раз NVIDIA подготовила ответную меру: ей стала GTX590, представляющая собой склейку из двух GTX580 со сниженными частотами. TDP достиг внушительных 365 Вт, вследствие чего карта впервые потребовала двух дополнительных разъемов питания 8-pin.
Одновременно с GTX590 появилась GeForce GTX 550 Ti на базе наследника GF106 — чипа GF116. В отличие от предшественницы, она получила 1 ГБ 192-битной памяти. Это стало возможным благодаря микросхемам памяти с разной плотностью. Позже на базе того же чипа вышла GT545 с 1.5 ГБ GDDR3.
Младший чип получил название GF119. Имеющий всего 48 SP и 64-битную шину, он нашел пристанище в самой бюджетной карте серии — GT520.
GeForce 600
Первой картой новой серии стала GTX680, выпущенная в марте 2012. В ее основе лежит архитектура Kepler, которая получила внутреннюю реорганизацию и поддерживает часть возможностей DirectX 11.1/11.2.
В ГП архитектур Tesla и Fermi шейдеры работают на своей частоте не просто так: на старых техпроцессах было невозможно «впихнуть» в чип большое количество SP, вместо этого увеличивали их частоту. Чипы Kepler перешли на 28 нм техпроцесс, который позволил разместить больше SP на той же площади, а также преодолеть барьер частоты ядра в 1 ГГц. Поэтому от старой схемы отказались, приведя к единой частоты работы ядра и шейдеров.
Основой GTX680 стал чип GK104. У него четыре GPC, но мультипроцессоров в каждом не по четыре, а по два. Теперь они содержат в себе гораздо большее количество SP — 192. Блок тесселяции Polymorph Engine 2.0 стал быстрее. Полный чип содержит 32 ROP, 128 TMU и 1536 SP. ГП получил поддержку шины PCI-E 3.0, удваивающей скорость обмена данными между картой и системой.
Ширину шины сократили до 256 бит, но за счет более быстрой GDDR5 пропускная способность осталась на уровне GTX580. Появилась технология GPU Boost — теперь частота ядра не фиксированная, а динамическая, в зависимости от нагрузки на ГП и его энергопотребления. Последнее стало довольно скромным — 195 Вт.
Карта конкурировала с ранее представленной Radeon HD7970, обгоняя ее в старых проектах. А вот в новых все было не так однозначно: представительница AMD получила новую архитектуру GCN, в которой устранили слабые места прошлого поколения, и с каждой новой игрой разрыв между картами только сокращался.
Вскоре появилась GTX690 — двухчиповая карта с парой GK104 и TDP 300 Вт. За ней последовала GTX670 со слегка урезанным чипом. Младший вариант на GK104 — GTX660 Ti. Как и прочие карты на чипе, она имеет 2 ГБ памяти GDDR5, но отличается 192-битной шиной.
GTX 660 появилась через полгода после выхода флагмана. В ее основу лег чип GK106 с 960 SP, а память представляли 2 ГБ 192-битной GDDR5. Чуть позже свет увидели две версии GTX650 Ti на том же чипе: обычная с урезанной до 128 бит шиной, и версия «Boost» с полной шиной памяти. Часть блоков в этих картах была отключена. К тому же, в отличие от старшей, они были доступны в двух версиях: с 1 и 2 ГБ памяти.
Младшим чипом GK107 оснащались две карты, GTX650 и GT640. Обе имели полную версию чипа с 384 SP, отличия в частотах и типе памяти: первая оснащалась GDDR5, вторая — GDDR3. Бюджетные карты GT630, GT620 и GT610 были построены на чипах архитектуры Fermi: GF108 и GF119.
GeForce 700
В феврале 2013 года была выпущена карта GTX Titan, с которой началась история GeForce 700, хотя номинально в эту линейку модель не входила.
GK110, ставший основой карты, построен на той же архитектуре Kepler. По сравнению с GK104, чип разросся «вширь». Новый ГП имеет пять GPC, в каждом из которых три SM. В каждом SM значительно возросло число блоков FP64, обычно используемых для неигровых вычислений — с 8 до 32.
Полный чип имеет 48 ROP, 240 TMU и 2880 SP. При этом количество активных блоков в карте было слегка сокращено. GK110 обладает 384-битной шиной памяти, которую у GTX Titan представляют 6 ГБ GDDR5. Ее пропускная способность достигла 288 ГБ/c. Технология GPU Boost была обновлена до версии 2.0, позволяющей эффективней повышать частоту с учетом температуры чипа. TDP карты достиг 288 Вт.
GTX Titan предназначался в первую очередь для неграфических вычислений, но на некоторое время получил статус самого быстрого игрового решения. Спустя три месяца NVIDIA выпустила первую игровую карту на чипе GK110 — GTX 780. Чтобы не составлять конкуренцию GTX Titan, чип был урезан еще сильнее, а cкорость вычислений FP64 ограничена. Карта получила 3 ГБ памяти, хотя иногда встречались и варианты с 6 ГБ.
Спустя год эту пару на посту сменили GTX Titan Black и GTX 780 Ti, обладающие чипами GK110 со всеми активными блоками. В мае 2014 NVIDIA представила двухчиповый GTX Titan Z, ставший кульминационной точкой развития архитектуры Kepler и последней картой компании с двумя ГП.
AMD ответила картами серии R9 290. Как и в случае с парой GTX680/HD7970, новая пара GTX780 Ti/R9 290X с переменным успехом «бодалась» друг с другом. Флагман NVIDIA на старте был быстрее и стоил дороже, но со временем карта AMD стала его обгонять.
Ступенькой ниже карт на GK110 расположились модели на уже знакомом нам GK104. GTX 680 «превратилась» в GTX770. GTX 760 получила на четверть урезанный чип, но за счет 256-битной шины памяти, хорошей производительности и гуманной цены карта стала очень популярным решением. Обе карты оснащались 2 или 4 ГБ памяти.
Февраль 2014 года принес с собой новинки: GTX750 и GTX750 Ti. В отличие от прочих решений GeForce 700, в них использовался новый ГП архитектуры Maxwell — GM107, подробнее о котором мы расскажем в третьей части истории.
Более бюджетные карты серии использовали как старые чипы GK107 и GF108, так и новый бюджетный чип архитектуры Kepler — GK208. Аналогично GK107, он имеет 384 SP, но обладает вдвое меньшим количеством растровых и текстурных блоков. Шина памяти сокращена до 64-битной, а интерфейс подключения к системе ограничен режимом PCI-E 2.0 x8. Полный чип лег в основу GT730, версия с половиной активных SP использовалась в GT720 и GT710.
С появлением ОС Windows 10 линейки видеокарт GeForce 400, 500, 600 и 700 получили частичную поддержку DirectX 12. Но полностью соответствуют функциям нового API только более современные поколения видеокарт, которые поддерживают его изначально.