Vaizdo plokštės: kas pasikeitė per 2014
Praėję metai pagimdė tokius monstrus, kaip GeForce GTX TITAN Z ir Radeon R9 295X2. Mes matėme, ką NVIDIA sugeba išspausti iš 28 nm standarto. 20-16 nm techproceso (tranzistorių dydis, kuo mažesni tuo daugiau jų galima sutalpinti procesoriaus kristale) gaminiai atidedami 2015-2016 metams, tačiau, sprendžiant iš to, ką apie juos žinome, mūsų laukia tikrai kažkas įspūdingo.
2013metai atnešė antros kartos galingas GPU, pagamintus su 28 nm ištobulintu techprocesu, – NVIDIA GK110 ir AMD Havajai (pastaroji, beje, iki šiol nematyto fizinio dydžio), o 2014-uoius sutikome, laukdami pirmųjų produktų, paremtų nauja gamybos technologija. Ir iš tiesų 20 nm procesorius tikrai pradėjo gaminti Taivano gamintojas TSMC, tačiau tik mobiliems prietaisams.
NVIDIA ir AMD kol kas stovi nuošalyje, nors buvo gandai, kad „raudonieji” pirmieji padarys perversmą ir išleis 20 nanometrų GPU 2014 pabaigoje. Šie planai dabar atidėti iki 2015 m, tačiau – jei tikėti gandais, kurie visi geriau vieni su kitais sutampa, artėjant naujų įrenginių išleidimo datai – už laukimą bus pilnai atlyginta.
Kas įvyko 2014
NVIDIA Maxwell debiutas
NVIDIA 28nm techproceso potencialo dar toli gražu neišsėmė. Kaip Kepler architektūros dalį, pavyko pagaminti tokį didelį procesorių, kaip GK110, susidedantį iš 7,1 milijardo tranzistorių, neviršijant 250 W šilumos paketo, kas yra aukštos klasės GPU orientyras. Bet Maxwell parodė, kad vis dar yra kur tobulėti.
Maxwell lustuose NVIDIA perdirbo steam mutiprocesoriaus (SMM), supaprastinant apkrovos planuotojo logiką. Tuo pavyko sumažinti SMM plotą, išlaikant apie 90% pradinio našumo. Tai davė beveik du kartus daugiau galios vienetui lyginant su Kepler, ne tik teoriškai, bet taip pat ir praktiškai.
Kol kas yra keturios Maxwell šeimos vaizdo plokštės – GeForce GTX 750/750 Ti, GeForce GTX 970 ir GTX 980. Likusias pozicijas NVIDIA modelių eilėje užima Kepler produktai. Apskritai, „žaliųjų” linija yra dabar gana sudėtingos struktūros ir apima GeForce 600 atstovus, GeForce 700 ir GeForce 900. Painiavą sustiprina faktas, kad NVIDIA stalinių kompiuterių vaizdo plokščių serijoje praleido GeForce 800.
Pradinio lygio žaidimų vaizdo plokštės GeForce GTX 750 ir GTX 750 Ti su GM107 lustu tapo bandomuoju Maxwell poligonu, kuris pirmą kartą parodė milžinišką naujos architektūros efektyvumą. Bandymuose GTX 750 Ti nugalėjo GeForce GTX 650 Ti ir Radeon R7 260X, kurių energijos suvartojimas yra beveik dvigubai didesnis.
Dar svarbiau yra tai, kad NVIDIA pavyko perkelti Maxwell privalumus didesniam GPU – GM204. Pagal dabartinią nomenklatūrą, tai antras pagal našumą lustas linijoje: jis turi 5,2 mlrd tranzistorių (palyginimui: GK110 – 7,1 milijardo). Nepaisant to, GeForce GTX 980 tapo lygiaverte GeForce GTX 780 Ti pamaina pagal našumą, nors pagal energijos suvartojimą yra panaši į GeForce GTX 770. Bet jei pažiūrėti iš kitos pusės, praktikoje GTX 980 nesuteikia beveik jokio spartos augimo, lyginant su GTX 780 Ti. Reali nauda tik tai, kad dėl pigesnės gamybos, vaizdo plokštės-flagmano su vienu GPU kainą pavyko sumažinti iki $549.
GeForce GTX 970, kurioje GM204 yra atjungta dalis skaičiavimo blokų – praktiniu požiūriu yra daug įdomesnė plokštė nei GTX 980. Dalis blokų atjukta, bet GTX 970 mažai nusileidžia našumu savo vyresniam giminaičiui ir prilygsta Radeon R9 290X. Be to vaizdo plokštės kaina gerokai mažesnė – $329.
AMD galėjo atsakyti į šį išpuolį tik vienu būdu – iš naujo nustatyti Radeon R9 290 ir 290X kainą iki to paties lygio. Pasiūlyti tinkamo varžovo GeForce GTX 980 „raudonieji” kol kas dar negali. Nepaisant to, AMD išlaiko tvirtą poziciją GP-GPU (ne grafinių skaičiavimų) srityje, kadangi GCN architektūra pritaikyta tokioms užduotims. NVIDIA, priešingai, paskutinėse savo silicio iteracijose sumažino valdymo logiką, kuri yra svarbi daugumai skaičiavimo užduočių.
GM204 taip pat aprūpintas specifinėmis renderingo funkcijomis, kurias NVIDIA naudoja paspartinti VXGI (Voxel Global Illumination) – globalaus apšvietimo metodo, pagrįsto vokseliais, veikiančio realiu laiku. Demonstracijos yra įspūdingos, tačiau, kaip paprastai atsitinka su išskirtinėmis technologijomis, VXGI įdiegimas realiuose žaidimuose priklausys nuo to ar būtini algoritmai bus įtraukti naują feature level DirectX 12 (aptarsime žemiau).
Dviejų GPU vaizdo plokštės NVIDIA GK110 ir AMD Hawaii
Kai vienas GPU negali užtikrinti skaičiavimo galios pažangos, į pagalbą ateina patikrintas sprendimas – dvi vaizdo plokštės. Nors SLI/CrossFire sistemą galima surinkti iš dviejų atskirų vaizdo plokščių GeForce GTX 780/780 Ti ar ATI Radeon R9 290/290X, dvigalvis monstras – tai gamintojo prestižo reikalas.
NVIDIA buvo lengviau susidoroti su šia problema, nes GK110 – šaltesnis lustas lyginant su AMD pasididžiavimu Hawaii. Trijų jungčių aušinimo sistema atrodo gąsdinančiai, bet jos dėka GTX TITAN Z gali pakeisti dviejų GTX TITAN Black rinkinį viename korpuse.
TITAN Z pristatoma kaip žaidimų ir profesionalios vaizdo plokštės derinys, ką sustiprinti visiškai atblokuoti FP64 vienetai. Bet kaina yra slegianti: ne mažiau nei tris tūkstančiai JAV dolerių (tūkstančiu daugiau už TITAN Black porą). TITAN Z gali būti reikalingas, kaip ne grafinio skaičiavimo akceleratorius kompaktiškose darbo stotyse, bet greičiausiai, tai bandymas pateisinti tokį beprotišką antkainį.
Kurdami konkuruojantį produktą – R9 295X2 – AMD ėmėsi drastiškų priemonių: du GPU Hawaii vienoje plokštėje neprarado dažnio lyginant su vieno GPU gaminiais, o šilumos išskyrimas pasiekia 300 vatų lustui. Bet vietoj to kad padidinti oro aušintuvo dydį, Radeon R9 295X2 tapo pirmąja vaizdo plokšte, kuri turi skysto aušinimo sistemą pradinėje konfigūracijoje.
Radeon R9 295X2 galima įsigyti už $1500, nors ji yra panaši našumu į TITAN Z, aiškiai lenkia pastarąją savo kaina. Tačiau pirkti du R9 295X2 žaidimams už vieno TITAN Z kainą – beprasmis veiksmas. Keturių GPU rinkinys niekada nebuvo rekomenduojamas šiam tikslui, ir programinė įranga tiesiog nėra optimizuota tokiai konfigūracijai. Bet kompaktiškam skaičiavimo klasteriui AMD pasiūlė geriausią įrangą. AMD neriboja GPU Hawaii našumo FP64 skaičiavimuose bet kuriuose produktuose.
DirectX 12
Išleidusi API Mantle, AMD paskatino DirectX plėtrą. Iki šio taško atrodė, kad labiausiai universalios API istorija eina į pabaigą. Iš tiesų, didelio DirectX atnaujinimo nebuvo nuo 2009 metų. Artėjantis DirectX 12 atnaujinimas yra skirtas ne išplėsti renderingo funkcijas, o optimizuoti runtime bibliotekų API.
MD parodė, kad esant tam tikrai apkrovai, DirectX 11 yra silpnoji sistemos vieta, ribojanti. Kalbama apie situacijas, kai ekrano erdvė yra pripildyta su daug atskirų objektų, net su paprasta geometrija. Šiuo atveju, CPU laikas yra naudojamas ne taip veiksmingai, kaip, naudojant tą patį Mantle.
Pertvarkytas Direct3D 12 renderingo konvejeris neturi šio trūkumo. Be to, API tapo žemesnio lygmens negu Direct3D 11. Kai kurios funkcijos, kurias biblioteka Direct3D 11 atliko pati, dabar priskirti programos grafikos varikliui, kas iš vienos pusės, leidžia efektyviau valdyti išteklius, o iš kitos – apsunkina programuotojo užduotį.
Potencialiai visi GPU, veikiantys su DirectX 11 suderinami ir su DirectX 12. Bet turime atskirti runtime biblioteką API ir naują feature level – renderingo funkcijų rinkinį. Microsoft įtraukė į standartą keletą technologijų, kurios nebus ypač pastebimos ekrane. Ateityje GPU įdiegs jas aparatūros lygmenyje.
API specifikacija jau pakankamai išbaigta, kad programų kūrėjai galėtų pradėti DX12 įdiegimą. Mircosoft pažadėjo pirmųjų žaidimų su DX12 atsiradimą 2015 pabaigoje. Dėl šios naujienos Mantle ateitis atrodo miglota, nors žaidimai su jos palaikymu ir toliau kuriami.
AMD ir NVIDIA vaizdo plokščių lentelės
AMD vaizdo plokštės | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Modelis | Grafikos procesorius | Atmintis | Magistralės jungties tipas | |||||||
Kodinis pavadinimas | Tranzitorių skaičius, mln | Tech procesas, nm | Taktinis dažnis, MHz High State / Boost State | Steam procesų skaičius | Atminties magistralė , bit | Mikroschemos tipas | Efektyvus dažnis, MHz | Dydis, MB | ||
Radeon R5 230 | Caicos | 370 | 40 | 625/– | 160 | 64 | GDDR3 SDRAM | 533 (1066) | 1024/2048 | PCI Express 2.1 x16 |
Radeon R7 240 | Oland PRO | 1040 | 28 | 730/780 | 320 | 128 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1125 (4500) | 1024/2048 | PCI Express 3.0 x16 |
Radeon R7 250 | Oland XT | 1040 | 28 | 1000/1050 | 320 | 128 | GDDR3/GDDR5 SDRAM | 900 (1800) / 1150 (4600) | 1024/2048 | PCI Express 3.0 x16 |
Radeon R7 250X | Cape Verde XT | 1500 | 28 | 1000/- | 640 | 128 | GDDR5 SDRAM | 1125 (4500) | 1024/2048 | PCI Express 3.0 x16 |
Radeon R7 260 | Bonaire | 2080 | 28 | -/1000 | 768 | 128 | GDDR5 SDRAM | 1500 (6000) | 1024/2048 | PCI Express 3.0 x16 |
Radeon R7 260X | Bonaire XTX | 2080 | 28 | -/1100 | 896 | 128 | GDDR5 SDRAM | 1625 (6500) | 1024/2048 | PCI Express 3.0 x16 |
Radeon R7 265 | Curacao PRO | 2800 | 28 | 900/925 | 1024 | 256 | GDDR5 SDRAM | 1400 (5600) | 2048 | PCI Express 3.0 x16 |
Radeon R9 270 | Curacao PRO | 2800 | 28 | 900/925 | 1280 | 256 | GDDR5 SDRAM | 1400 (5600) | 2048 | PCI Express 3.0 x16 |
Radeon R9 270X | Curacao XT | 2800 | 28 | 1000/1050 | 1280 | 256 | GDDR5 SDRAM | 1400 (5600) | 2048 | PCI Express 3.0 x16 |
Radeon R7 280 | Tahiti PRO | 4313 | 28 | 827/933 | 1792 | 384 | GDDR5 SDRAM | 1250 (5000) | 3072 | PCI Express 3.0 x16 |
Radeon R9 280X | Tahiti XT2 / Tahiti XTL | 4313 | 28 | 850/1000 | 2048 | 384 | GDDR5 SDRAM | 1500 (6000) | 3072 | PCI Express 3.0 x16 |
Radeon R9 285 | Tonga PRO | ND | 28 | 918/- | 1792 | 256 | GDDR5 SDRAM | 1375 (5500) | 2048 | PCI Express 3.0 x16 |
Radeon R9 290 | Hawaii PRO | 6020 | 28 | -/947 | 2560 | 512 | GDDR5 SDRAM | 1250 (5000) | 4096 | PCI Express 3.0 x16 |
Radeon R9 290X | Hawaii XT | 6020 | 28 | -/1000 | 2816 | 512 | GDDR5 SDRAM | 1250 (5000) | 4096 | PCI Express 3.0 x16 |
Radeon R9 295X2 | Vesuvius (2 × Hawaii XT) | 2 × 6020 | 28 | ND/1018 | 2 × 2816 | 2 × 512 | GDDR5 SDRAM | 1250 (5000) | 2 × 4096 | PCI Express 3.0 x16 |
NVIDIA vaizdo plokštės | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Modelis | Grafikos procesorius | Atmintis | Magistralės jungties tipas | |||||||
Kodinis pavadinimas | Tranzistorių skaičius, mln | Techprocesas, nm | Taktinis dažnis, MHz: Base Clock / Boost Clock | CUDA Branduolių skaičius | Atminties magistralė , bit | Mikroschemos tipas | Efektyvus dažnis, MHz | Dydis, MB | ||
GeForce GT 610 | GF119 | 292 | 40 | 810/- | 48 | 64 | GDDR3 SDRAM | 900 (1800) | 1024 | PCI Express 2.0 x16 |
GeForce GT 730 (128-bit) | GF108 | 585 | 40 | 700/- | 96 | 128 | GDDR3 SDRAM | 900 (1800) | 1024 | PCI-Express 2.0 x16 |
GeForce GT 720 | GK208 | 1300 | 28 | 797/- | 192 | 64 | GDDR3 / GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 2.0 x16 |
GeForce GT 730 (64-bit) | GK208 | 1300 | 28 | 902/- | 384 | 64 | GDDR3 / GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 2.0 x16 |
GeForce GT 740 | GK107 | 1300 | 28 | 902/- | 384 | 128 | GDDR3 / GDDR5 SDRAM | 900 (1800) / 1250 (5000) | 1024/2048 | PCI-Express 3.0 x16 |
GeForce GTX 750 | GM107 | 1870 | 28 | 1020/1085 | 512 | 128 | GDDR5 SDRAM | 1250 (5000) | 1024 | PCI-Express 3.0 x16 |
GeForce GTX 750 Ti | GM107 | 1870 | 28 | 1020/1085 | 640 | 128 | GDDR5 SDRAM | 1350 (5000) | 2048 | PCI-Express 3.0 x16 |
GeForce GTX 660 | GK106 | 2 540 | 28 | 980/1033 | 960 | 192 | GDDR5 SDRAM | 1502 (6008) | 2048 | PCI-Express 3.0 x16 |
GeForce GTX 760 | GK104 | 3 540 | 28 | 980/1033 | 1152 | 256 | GDDR5 SDRAM | 1502 (6008) | 2048 | PCI-Express 3.0 x16 |
GeForce GTX 670 | GK104 | 3 540 | 28 | 915/980 | 1344 | 256 | GDDR5 SDRAM | 1502 (6008) | 2048 | PCI-Express 3.0 x16 |
GeForce GTX 970 | GM204 | 5 200 | 28 | 1050/1178 | 1664 | 256 | GDDR5 SDRAM | 1750 (7000) | 4096 | PCI-Express 3.0 x16 |
GeForce GTX 980 | GM204 | 5 200 | 28 | 1126/1216 | 2048 | 256 | GDDR5 SDRAM | 1750 (7000) | 4096 | PCI-Express 3.0 x16 |
GeForce GTX TITAN Black | GK110 | 7 100 | 28 | 889/980 | 2880 | 384 | GDDR5 SDRAM | 1750 (7000) | 6144 | PCI-Express 3.0 x16 |
GeForce GTX TITAN Z | GK110 | 7 100 | 28 | 705/876 | 2880 | 2 × 384 | GDDR5 SDRAM | 1750 (7000) | 2 × 6144 | PCI-Express 3.0 x16 |