Vaizdo plokštės: kas pasikeitė per 2014

Praėję metai pagimdė tokius monstrus, kaip GeForce GTX TITAN Z ir Radeon R9 295X2. Mes matėme, ką NVIDIA sugeba išspausti iš 28 nm standarto. 20-16 nm techproceso (tranzistorių dydis, kuo mažesni tuo daugiau jų galima sutalpinti procesoriaus kristale) gaminiai atidedami 2015-2016 metams, tačiau, sprendžiant iš to, ką apie juos žinome, mūsų laukia tikrai kažkas įspūdingo.

2013metai atnešė antros kartos galingas GPU, pagamintus su 28 nm ištobulintu techprocesu, – NVIDIA GK110 ir AMD Havajai (pastaroji, beje, iki šiol nematyto fizinio dydžio), o 2014-uoius sutikome, laukdami pirmųjų produktų, paremtų nauja gamybos technologija. Ir iš tiesų 20 nm procesorius tikrai pradėjo gaminti Taivano gamintojas TSMC, tačiau tik mobiliems prietaisams.

NVIDIA ir AMD kol kas stovi nuošalyje, nors buvo gandai, kad „raudonieji” pirmieji padarys perversmą ir išleis 20 nanometrų GPU 2014 pabaigoje. Šie planai dabar atidėti iki 2015 m, tačiau – jei tikėti gandais, kurie visi geriau vieni su kitais sutampa, artėjant naujų įrenginių išleidimo datai – už laukimą bus pilnai atlyginta.

Kas įvyko 2014

NVIDIA Maxwell debiutas

NVIDIA 28nm techproceso potencialo dar toli gražu neišsėmė. Kaip Kepler architektūros dalį, pavyko pagaminti tokį didelį procesorių, kaip GK110, susidedantį iš 7,1 milijardo tranzistorių, neviršijant 250 W šilumos paketo, kas yra aukštos klasės GPU orientyras. Bet Maxwell parodė, kad vis dar yra kur tobulėti.

Maxwell lustuose NVIDIA perdirbo steam mutiprocesoriaus (SMM), supaprastinant apkrovos planuotojo logiką. Tuo pavyko sumažinti SMM plotą, išlaikant apie 90% pradinio našumo. Tai davė beveik du kartus daugiau galios vienetui lyginant su Kepler, ne tik teoriškai, bet taip pat ir praktiškai.

NVIDIA GeForce GTX 750 Ti
NVIDIA GeForce GTX 750 Ti

Kol kas yra keturios Maxwell šeimos vaizdo plokštės – GeForce GTX 750/750 Ti, GeForce GTX 970 ir GTX 980. Likusias pozicijas NVIDIA modelių eilėje užima Kepler produktai. Apskritai, „žaliųjų” linija yra dabar gana sudėtingos struktūros ir apima GeForce 600 atstovus, GeForce 700 ir GeForce 900. Painiavą sustiprina faktas, kad NVIDIA stalinių kompiuterių vaizdo plokščių serijoje praleido GeForce 800.

Pradinio lygio žaidimų vaizdo plokštės GeForce GTX 750 ir GTX 750 Ti su GM107 lustu tapo bandomuoju Maxwell poligonu, kuris pirmą kartą parodė milžinišką naujos architektūros efektyvumą. Bandymuose GTX 750 Ti nugalėjo GeForce GTX 650 Ti ir Radeon R7 260X, kurių energijos suvartojimas yra beveik dvigubai didesnis.

Dar svarbiau yra tai, kad NVIDIA pavyko perkelti Maxwell privalumus didesniam GPU – GM204. Pagal dabartinią nomenklatūrą, tai antras pagal našumą lustas linijoje: jis turi 5,2 mlrd tranzistorių (palyginimui: GK110 – 7,1 milijardo). Nepaisant to, GeForce GTX 980 tapo lygiaverte GeForce GTX 780 Ti pamaina pagal našumą, nors pagal energijos suvartojimą yra panaši į GeForce GTX 770. Bet jei pažiūrėti iš kitos pusės, praktikoje GTX 980 nesuteikia beveik jokio spartos augimo, lyginant su GTX 780 Ti. Reali nauda tik tai, kad dėl pigesnės gamybos, vaizdo plokštės-flagmano su vienu GPU kainą pavyko sumažinti iki $549.

NVIDIA GeForce GTX 980
NVIDIA GeForce GTX 980

GeForce GTX 970, kurioje GM204 yra atjungta dalis skaičiavimo blokų – praktiniu požiūriu yra daug įdomesnė plokštė nei GTX 980. Dalis blokų atjukta, bet GTX 970 mažai nusileidžia našumu savo vyresniam giminaičiui ir prilygsta Radeon R9 290X. Be to vaizdo plokštės kaina gerokai mažesnė – $329.

AMD galėjo atsakyti į šį išpuolį tik vienu būdu – iš naujo nustatyti Radeon R9 290 ir 290X kainą iki to paties lygio. Pasiūlyti tinkamo varžovo GeForce GTX 980 „raudonieji” kol kas dar negali. Nepaisant to, AMD išlaiko tvirtą poziciją GP-GPU (ne grafinių skaičiavimų) srityje, kadangi GCN architektūra pritaikyta tokioms užduotims. NVIDIA, priešingai, paskutinėse savo silicio iteracijose sumažino valdymo logiką, kuri yra svarbi daugumai skaičiavimo užduočių.

GM204 taip pat aprūpintas specifinėmis renderingo funkcijomis, kurias NVIDIA naudoja paspartinti VXGI (Voxel Global Illumination) – globalaus apšvietimo metodo, pagrįsto vokseliais, veikiančio realiu laiku. Demonstracijos yra įspūdingos, tačiau, kaip paprastai atsitinka su išskirtinėmis technologijomis, VXGI įdiegimas realiuose žaidimuose priklausys nuo to ar būtini algoritmai bus įtraukti naują feature level DirectX 12 (aptarsime žemiau).

VXGI
VXGI

Dviejų GPU vaizdo plokštės NVIDIA GK110 ir AMD Hawaii

Kai vienas GPU negali užtikrinti skaičiavimo galios pažangos, į pagalbą ateina patikrintas sprendimas – dvi vaizdo plokštės. Nors SLI/CrossFire sistemą galima surinkti iš dviejų atskirų vaizdo plokščių GeForce GTX 780/780 Ti ar ATI Radeon R9 290/290X, dvigalvis monstras – tai gamintojo prestižo reikalas.

NVIDIA buvo lengviau susidoroti su šia problema, nes GK110 – šaltesnis lustas lyginant su AMD pasididžiavimu Hawaii. Trijų jungčių aušinimo sistema atrodo gąsdinančiai, bet jos dėka GTX TITAN Z gali pakeisti dviejų GTX TITAN Black rinkinį viename korpuse.

TITAN Z pristatoma kaip žaidimų ir profesionalios vaizdo plokštės derinys, ką sustiprinti visiškai atblokuoti FP64 vienetai. Bet kaina yra slegianti: ne mažiau nei tris tūkstančiai JAV dolerių (tūkstančiu daugiau už TITAN Black porą). TITAN Z gali būti reikalingas, kaip ne grafinio skaičiavimo akceleratorius kompaktiškose darbo stotyse, bet greičiausiai, tai bandymas pateisinti tokį beprotišką antkainį.

NVIDIA GeForce GTX TITAN Z
NVIDIA GeForce GTX TITAN Z

Kurdami konkuruojantį produktą – R9 295X2 – AMD ėmėsi drastiškų priemonių: du GPU Hawaii vienoje plokštėje neprarado dažnio lyginant su vieno GPU gaminiais, o šilumos išskyrimas pasiekia 300 vatų lustui. Bet vietoj to kad padidinti oro aušintuvo dydį, Radeon R9 295X2 tapo pirmąja vaizdo plokšte, kuri turi skysto aušinimo sistemą pradinėje konfigūracijoje.

Radeon R9 295X2 galima įsigyti už $1500, nors ji yra panaši našumu į TITAN Z, aiškiai lenkia pastarąją savo kaina. Tačiau pirkti du R9 295X2 žaidimams už vieno TITAN Z kainą – beprasmis veiksmas. Keturių GPU rinkinys niekada nebuvo rekomenduojamas šiam tikslui, ir programinė įranga tiesiog nėra optimizuota tokiai konfigūracijai. Bet kompaktiškam skaičiavimo klasteriui AMD pasiūlė geriausią įrangą. AMD neriboja GPU Hawaii našumo FP64 skaičiavimuose bet kuriuose produktuose.

AMD Radeon R9 295X2
AMD Radeon R9 295X2

DirectX 12

Išleidusi API Mantle, AMD paskatino DirectX plėtrą. Iki šio taško atrodė, kad labiausiai universalios API istorija eina į pabaigą. Iš tiesų, didelio DirectX atnaujinimo nebuvo nuo 2009 metų. Artėjantis DirectX 12 atnaujinimas yra skirtas ne išplėsti renderingo funkcijas, o optimizuoti runtime bibliotekų API.

MD parodė, kad esant tam tikrai apkrovai, DirectX 11 yra silpnoji sistemos vieta, ribojanti. Kalbama apie situacijas, kai ekrano erdvė yra pripildyta su daug atskirų objektų, net su paprasta geometrija. Šiuo atveju, CPU laikas yra naudojamas ne taip veiksmingai, kaip, naudojant tą patį Mantle.dx12

Pertvarkytas Direct3D 12 renderingo konvejeris neturi šio trūkumo. Be to, API tapo žemesnio lygmens negu Direct3D 11. Kai kurios funkcijos, kurias biblioteka Direct3D 11 atliko pati, dabar priskirti programos grafikos varikliui, kas iš vienos pusės, leidžia efektyviau valdyti išteklius, o iš kitos – apsunkina programuotojo užduotį.

Potencialiai visi GPU, veikiantys su DirectX 11 suderinami ir su DirectX 12. Bet turime atskirti runtime biblioteką API ir naują feature level – renderingo funkcijų rinkinį. Microsoft įtraukė į standartą keletą technologijų, kurios nebus ypač pastebimos ekrane. Ateityje GPU įdiegs jas aparatūros lygmenyje.

API specifikacija jau pakankamai išbaigta, kad programų kūrėjai galėtų pradėti DX12 įdiegimą. Mircosoft pažadėjo pirmųjų žaidimų su DX12 atsiradimą 2015 pabaigoje. Dėl šios naujienos Mantle ateitis atrodo miglota, nors žaidimai su jos palaikymu ir toliau kuriami.

AMD ir NVIDIA vaizdo plokščių lentelės

AMD vaizdo plokštės

Modelis

Grafikos procesorius

Atmintis

Magistralės jungties tipas

Kodinis pavadinimas

Tranzitorių skaičius, mln

Tech procesas, nm

Taktinis dažnis, MHz High State / Boost State

Steam procesų skaičius

Atminties magistralė , bit

Mikroschemos tipas

Efektyvus  dažnis, MHz

Dydis, MB

Radeon R5 230

Caicos

370

40

625/–

160

64

GDDR3 SDRAM

533 (1066)

1024/2048

PCI Express 2.1 x16

Radeon R7 240

Oland PRO

1040

28

730/780

320

128

GDDR3/GDDR5 SDRAM

900 (1800) / 1125 (4500)

1024/2048

PCI Express 3.0 x16

Radeon R7 250

Oland XT

1040

28

1000/1050

320

128

GDDR3/GDDR5 SDRAM

900 (1800) / 1150 (4600)

1024/2048

PCI Express 3.0 x16

Radeon R7 250X

Cape Verde XT

1500

28

1000/-

640

128

GDDR5 SDRAM

1125 (4500)

1024/2048

PCI Express 3.0 x16

Radeon R7 260

Bonaire

2080

28

-/1000

768

128

GDDR5 SDRAM

1500 (6000)

1024/2048

PCI Express 3.0 x16

Radeon R7 260X

Bonaire XTX

2080

28

-/1100

896

128

GDDR5 SDRAM

1625 (6500)

1024/2048

PCI Express 3.0 x16

Radeon R7 265

Curacao PRO

2800

28

900/925

1024

256

GDDR5 SDRAM

1400 (5600)

2048

PCI Express 3.0 x16

Radeon R9 270

Curacao PRO

2800

28

900/925

1280

256

GDDR5 SDRAM

1400 (5600)

2048

PCI Express 3.0 x16

Radeon R9 270X

Curacao XT

2800

28

1000/1050

1280

256

GDDR5 SDRAM

1400 (5600)

2048

PCI Express 3.0 x16

Radeon R7 280

Tahiti PRO

4313

28

827/933

1792

384

GDDR5 SDRAM

1250 (5000)

3072

PCI Express 3.0 x16

Radeon R9 280X

Tahiti XT2 / Tahiti XTL

4313

28

850/1000

2048

384

GDDR5 SDRAM

1500 (6000)

3072

PCI Express 3.0 x16

Radeon R9 285

Tonga PRO

ND

28

918/-

1792

256

GDDR5 SDRAM

1375 (5500)

2048

PCI Express 3.0 x16

Radeon R9 290

Hawaii PRO

6020

28

-/947

2560

512

GDDR5 SDRAM

1250 (5000)

4096

PCI Express 3.0 x16

Radeon R9 290X

Hawaii XT

6020

28

-/1000

2816

512

GDDR5 SDRAM

1250 (5000)

4096

PCI Express 3.0 x16

Radeon R9 295X2

Vesuvius (2 × Hawaii XT)

2 × 6020

28

ND/1018

2 × 2816

2 × 512

GDDR5 SDRAM

1250 (5000)

2 × 4096

PCI Express 3.0 x16

NVIDIA vaizdo plokštės

Modelis

Grafikos procesorius

Atmintis

Magistralės jungties tipas

Kodinis pavadinimas

Tranzistorių skaičius, mln

Techprocesas, nm

Taktinis dažnis, MHz: Base Clock / Boost Clock

CUDA Branduolių skaičius

Atminties magistralė , bit

Mikroschemos tipas

Efektyvus dažnis, MHz

Dydis, MB

GeForce GT 610

GF119

292

40

810/-

48

64

GDDR3 SDRAM

900 (1800)

1024

PCI Express 2.0 x16

GeForce GT 730 (128-bit)

GF108

585

40

700/-

96

128

GDDR3 SDRAM

900 (1800)

1024

PCI-Express 2.0 x16

GeForce GT 720

GK208

1300

28

797/-

192

64

GDDR3 / GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 2.0 x16

GeForce GT 730 (64-bit)

GK208

1300

28

902/-

384

64

GDDR3 / GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 2.0 x16

GeForce GT 740

GK107

1300

28

902/-

384

128

GDDR3 / GDDR5 SDRAM

900 (1800) / 1250 (5000)

1024/2048

PCI-Express 3.0 x16

GeForce GTX 750

GM107

1870

28

1020/1085

512

128

GDDR5 SDRAM

1250 (5000)

1024

PCI-Express 3.0 x16

GeForce GTX 750 Ti

GM107

1870

28

1020/1085

640

128

GDDR5 SDRAM

1350 (5000)

2048

PCI-Express 3.0 x16

GeForce GTX 660

GK106

2 540

28

980/1033

960

192

GDDR5 SDRAM

1502 (6008)

2048

PCI-Express 3.0 x16

GeForce GTX 760

GK104

3 540

28

980/1033

1152

256

GDDR5 SDRAM

1502 (6008)

2048

PCI-Express 3.0 x16

GeForce GTX 670

GK104

3 540

28

915/980

1344

256

GDDR5 SDRAM

1502 (6008)

2048

PCI-Express 3.0 x16

GeForce GTX 970

GM204

5 200

28

1050/1178

1664

256

GDDR5 SDRAM

1750 (7000)

4096

PCI-Express 3.0 x16

GeForce GTX 980

GM204

5 200

28

1126/1216

2048

256

GDDR5 SDRAM

1750 (7000)

4096

PCI-Express 3.0 x16

GeForce GTX TITAN Black

GK110

7 100

28

889/980

2880

384

GDDR5 SDRAM

1750 (7000)

6144

PCI-Express 3.0 x16

GeForce GTX TITAN Z

GK110

7 100

28

705/876

2880

2 × 384

GDDR5 SDRAM

1750 (7000)

2 × 6144

PCI-Express 3.0 x16