Nvidia GeForce GTX 590 3 GB: Nvidia vastaa 1024 CUDA-ytimen voimin

Artikkelin kirjoittaja: Teemu Laitila

Nvidia GeForce GTX 590 3 GB: Nvidian vastaus 1024 CUDA-ytimen voimin


GeForce GTX 590: Nvidia vastaa


Tänään yksi teknologiamaailman huonoiten pidetyistä salaisuuksista astuu viimein kunnolla julkisuuteen. Vai kolme viikkoa AMD:n Radeon HD 6990:n julkistuksen jälkeen, Nvidia haastaa tuoreen johtajan GeForce GTX 590 3 GB -mallillaan. Nvidian mukaan kortti olisi voitu tuoda markkinoille jo yli kuukausi sitten. Mutta tiedämme, että Nvidia päätti viivästyttää julkaisua ja tehdä viimeisiä säätöjä pitkälle maaliskuuhun. Tuloksena on näytönohjain, jonka suunnittelussa on tietoisesti painotettu tyylikkyyttä, heti sen jälkeen kun AMD hakkasi meitä päähän korvia särkevällä tuuletusratkaisullaan.


Hiljaisen jäähdytyksen tavoittelu saattaa kuulostaa epätoivoiselta, ottaen huomioon, että Nvidian Fermi-pohjaiset GPU:t ovat surullisenkuuluisia kuumuudestaan ja tehonkulutuksestaan. Ajatus piirilevystä, jossa on kaksi Fermi-GPU:ta ja joka ei pidä kovempaa meteliä kuin AMD:n kahden Cayman-piirin ohjain kuulostaa uskomattomalta. Silti se on juuri se, mitä Nvidia väittää tehneensä.

Sen saavuttaminen ei ollut helppo tehtävä. Kompromisseja jouduttiin tekemään. Nvidia käyttää esimerkiksi samaa keskelle asennettuun tuulettimeen perustuvaa jäähdytystekniikkaa, josta AMD:tä kritisoitiin. Grafiikkapiirien kellotaajuuksia jouduttiin laskemaan, jota lämpötila pysyisi aisoissa. Pienemmistä kelloista huolimatta kortti käyttää silti enemmän tehoa kuin mikään mitä olemme tähän mennessä testanneet.



Se on silti hiljainen. Hullun hiljainen. Hiljaisin dual-GPU-näytönohjain, jota olen testannut sitten ATI:n Rage Fury Maxx –mallin (onko esimerkki tarpeeksi kaukaa historiasta?) Nvidia siis onnistui tehtävässään hiljaisuuden suhteen. Jäljelle jää kuitenkin kysymys: oliko Nvidian pakko antaa periksi nopeudessa vain näyttääkseen AMD:lle, että kuumatkin kortit voivat olla hiljaisia?

Konepellin alla: kaksi kokonaista GF110-piiriä

Aiemmissa Nvidian kanssa käymissäni keskusteluissa kävi selväksi, että yhtiö halusi käyttää kahta GF110-piiriä eikä se halunnut leikellä niitä. Jos olet lukenut GeForce GTX 580 ja GF100: Niin kuin Nvidia tarkoitti pelaamisen –artikkelin, saatat muistaa että kokonaiset GF110-piirit sisältävät neljä Graphics Processing Cluster -yksikköä, joista jokainen sisältää neljä Streaming Multiprocessor -yksikköä. Jokaisesta SM-yksiköstä löytyy 32 CUDA-ydintä, eli niitä on yhteensä 512 kappaletta GPU:ta kohden. Jokainen SM sisältää myös neljä tekstuuriyksikköä, eli 64 per siru. Jokaisesta SM-yksiköstä löytyy myös yksi Polymorph Engine, joka kuitenkaan ei aiempien kokemusten mukaan ole erityisen tehokkaasti skaalautuva keino lisätä rinnakkaisuutta geometriassa.



GPU:n taustaosiot sisältävät kuusi ROP-osiota joista jokainen suoltaa ulos kahdeksan 32-bittistä kokonaislukupikseliä kerrallaan, mikä tekee 48 pikseliä kellojaksoa kohti. 384-bittinen muistiväylä muodostuu kuudesta 64-bittisestä väylästä, joiden päistä löytyy 256 MB GDDR5-muistia. Se tekee yhteensä 1,5 GB muistia GPU:ta kohti ja siitä päästään GeForce GTX 590:n 3 GB muistimäärään.

Nvidia on liittänyt GTX 590:n GF110-piirit toisiinsa omalla NF200-siltapiirillään, joka multiplexoi yhden 16-kaistaisen PCI Express 2.0 –väylän kahdeksi 16-kaistaiseksi väyläksi jakaen sen GPU:iden välillä.


GeForce GTX 590
GeForce GTX 580 Radeon HD 6990
Radeon HD 6970
Radeon HD 6950
Valmistuprosessi
40 nm TSMC 40 nm TSMC 40 nm TSMC 40 nm TSMC
40 nm TSMC
Sirun koko
2 x 520 mm² 520 mm² 2 x 389 mm² 389 mm² 389 mm²
Transistoreita
2 x 3 miljardia 3 miljardia 2 x 2.64 miljardia 2.64 miljardia
2.64 miljardia
Ytimen kellotaajuus
607 MHz
772 MHz 830 MHz 880 MHz
800 MHz
Stream-prosessorit / CUDA-ytimet
1024
512 3072
1536
1408
Laskentateho
2.49 TFLOPS
1.58 TFLOPS 5.1 TFLOPS
2.7 TFLOPS
2.25 TFLOPS
Tekstuuriyksiköt
128
64 192
96
88
Tekstuurien täyttönopeus
77.7 Gtex/s
49.4 Gtex/s 159.4 Gtex/s
84.5 Gtex/s
70.4 Gtex/s
ROPs
96
48 64
32
32
Pikselien täyttönopeus
58.3 Gpix/s
37.1 Gpix/s 53.1 Gpix/s
28.2 Gpix/s
25.6 Gpix/s
Näyttömuisti
2 x 1.5 GB GDDR5
1.5 GB GDDR5 2 x 2 GB GDDR5
2 GB GDDR5
2 GB GDDR5
Muistin kellotaajuus
853 MHz
1002 MHz 1250 MHz
1375 MHz
1250 MHz
Muistikaista
2 x 163.9 GB/s
(384-bit)
192 GB/s (384-bit) 2 x 160 GB/s (256-bit) 176 GB/s (256-bit)
160 GB/s (256-bit)
Enimmäistehonkulutus
365 W
244 W 375 W
250 W
200 W


Millaisia muutoksia tapahtui GeForce GTX 480 –mallissa käytetyn GF100-piirin ja GeForce GTX 580 –mallissa käytetyn uudemman GF110-piirin välillä? Aiemmasta artikkelista:

Ensiksikin grafiikkaydin itsessään on pitkälti sama. Tämä ei muistuta ollenkaan GF100:n ja GF104:n välillä tapahtunutta muutosta, jossa Shader Multiprocessor –yksiköt sijoiteltiin uudestaan paremman suorituskyvyn saavuttamiseksi kuluttajahintaluokassa (eli saavutettiin enemmän tehoa teksturointiin). Kuten edeltäjässään, tässäkin mallissa painotetaan raakaa laskentakykyä. GF110 sisältää itse asiassa vain kaksi uutta ominaisuutta: täyden nopeuden FP16-suodatus ja paranneltu Z-puskurointi.

GF110 pystyy suorittamaan FP16-tekstuurisuodatuksen yhden kellojakson aikana (kuten myös GF104), kun GF100 käytti siihen kaksi kellojaksoa. Tekstuurirajoittuneissa ohjelmissa tämä saattaa näkyä parempana suorituskykynä. Z-puskuroinnin parannukset parantavat suorituskykyä niissä peleissä, joissa tapahtuu paljon tarpeetonta näkymättömien kappaleiden renderöintiä parantamalla muistikaistan tehokasta käyttöä. Nvidian mukaan näillä parannuksilla saavutetaan noin 14 prosentin tehonlisäys kellojaksoa kohti.




Näiden muutosten lisäksi kyseessä on edelleen TSMC:n 40 nm:n valmistusprosessin tuotos, joka sisältää karkeasti ottaen kolme miljardia transistoria. 520 neliömillimetrin pinta-alallaan GF110 on huomattavasti suurempi kuin AMD:n Cayman-piirit, joiden pinta-ala on vain 389 neliömillimetriä sisältäen 2,64 miljardia transistoria.

On hienoa, että Nvidia on saanut kaikki käytössä olevat resurssit sisällytettyä kahteen kertaan GeForce GTX 590 –ohjaimeen. GeForce GTX 580 –mallissa käytetään kuitenkin 772 MHz:n kellotaajuutta ytimen osalta ja 1002 MHz:n muistien osalta, kun taas GTX 590:n tapauksessa kelloja on jouduttu laskemaan 607 MHz:n ja 853 MHz:n.

Näiden muutosten jälkeen tämän kortin suorituskyky ei yllä niihin lukemiin, joita kahdelta Nvidian nopeimmalta yhden GPU:n lippulaivamallilta voisi odottaa. Se saattaa olla silti riittävästi. AMD julkaisi Radeon HD 5970:n nimenomaan GeForce GTX 570:n kilpailijaksi, 580 jäi täysin omaan luokkaansa suorituskykynsä puolesta. Vaikka Radeon HD 6990 onnistuu lähes tuplaamaan yhtiön nopeimman yhden GPU:n kortin tehot, GeForce GTX 590:n ei tarvitse yltää samaan ollakseen kilpailukykyinen 700 dollarin hintaluokassa, johon AMD oman korttinsa sijoitti.

Tiedämme jo millaisiin toimiin AMD:n piti ryhtyä saavuttaakseen ”maailman nopein näytönohjain” arvonimen. Miten Nvidia vastaa haasteeseen?

Kommentoi artikkelia