GeForce GTX 580 ja GF110: Niin kuin Nvidia tarkoitti pelaamisen

Artikkelin kirjoittaja: Teemu Laitila | 0 kommenttia

GF110: kasvojenkohotus Fermille



Kuten mainitsin aiemmin, GF110 on selvästi edelleen kehitetty versio aiemmasta tekniikasta ja Nvidialla oli jo vahva perusta GF100:n suunnittelussa, joten varsinaiset tekniset muutokset jäävät hyvin pieniksi. GF110 valmistetaan edelleen 40 nm:n tekniikalla ja se koostuu noin kolmesta miljardista transistorista.

Ensiksikin grafiikkaydin itsessään on pitkälti sama. Tämä ei muistuta ollenkaan GF100:n ja GF104:n välillä tapahtunutta muutosta, jossa Shader Multiprocessor –yksiköt sijoiteltiin uudestaan paremman suorituskyvyn saavuttamiseksi kuluttajahintaluokassa (eli saavutettiin enemmän tehoa teksturointiin). Kuten edeltäjässään, tässäkin mallissa painotetaan raakaa laskentakykyä. GF110 sisältää itse asiassa vain kaksi uutta ominaisuutta: täyden nopeuden FP16-suodatus ja paranneltu Z-puskurointi.



GF110 pystyy suorittamaan FP16-tekstuurisuodatuksen yhden kellojakson aikana (kuten myös GF104), kun GF100 käytti siihen kaksi kellojaksoa. Tekstuurirajoittuneissa ohjelmissa tämä saattaa näkyä parempana suorituskykynä. Z-puskuroinnin parannukset parantavat suorituskykyä niissä peleissä, joissa tapahtuu paljon tarpeetonta näkymättömien kappaleiden renderöintiä parantamalla muistikaistan tehokasta käyttöä. Nvidian mukaan näillä parannuksilla saavutetaan noin 14 prosentin tehonlisäys kellojaksoa kohti.


GeForce GTX 580
GeForce GTX 480
GeForce GTX 470
Prosessointiklustereita(GPCs)
4
4
4
Streaming Multiprocessor -yksiköitä (SM)
16
15
14
CUDA-ytimiä
512
480
448
Tekstuuriyksiköitä
64
60
56
ROP-yksiköitä
48
48
40
Ytimen kellotaajuus
772 MHz
700 MHz
607 MHz
Varjostimien kellotaajuus
1544 MHz
1401 MHz
1215 MHz
Muistien kellotaajuus (Datanopeus)
1002 MHz (4008 MT/s)
924 MHz (3696 MT/s)
837 MHz (3348 MT/s)
Muistin määrä
1.5 GB GDDR5
1.5 GB GDDR5
1.25 GB GDDR5
Muistiväylä
384-bit
384-bit
320-bit
Muistin väylänleveys
192.4 GB/s
177.4 GB/s
133.9 GB/s
Tekstuurien täyttönopeus
49.4 GTexels/s
42.0 GTexels/s
34.0 GTexels/s
Valmistusprosessi
40 nm TSMC
40 nm TSMC
40 nm TSMC
Kokoluokks
Dual-slot
Dual-slot
Dual-slot
Näytön liitännät
2 x DL-DVI, 1 x mini-HDMI 2 x DL-DVI, 1 x mini-HDMI
2 x DL-DVI, 1 x mini-HDMI


Osa GF100:n suhteen tapahtuneista muutoksista sisältää muutoksia piiriin tasolla. Piirin suunnittelijoilla on käytössään eri tyyppisiä transistoreita, joita käyttämällä voidaan painottaa tiettyjä ominaisuuksia. Nvidian insinöörit kävivät läpi GF100:n rakenteen ja oletettavasti tekivät kohtuullisen paljon muutoksia. Piirissä otettiin käyttöön hitaammat ja vähemmän vuotavat transistorit niissä kohdin, joissa nopeus ei ole ensisijaisen tärkeää. Nopeutta vaativissa osissa käytettiin nopeampia ja enemmän vuotavia transistoreita.

Näillä toimenpiteillä saavutettiin niin tuntuvia säästöjä tehonkulutuksessa, että Nvdia kykeni ottamaan käyttöön kuudennentoista Shader Multiprocessor –yksikön, joka aiemmassa versiossa oli käännetty pois päältä (näin saatiin käyttöön 32 CUDA-ydintä, neljä tekstuuriyksikköä ja yksi PolyMorph-gemetriayksikkö). Se mahdollisti jopa kellotaajuuksien nostamisen. GeForce GTX 480 toimii ytimen/varjostimien/muistin osalta 700/1401/924 MHz:n taajuudella. GTX 580 on nostettu ytimen osalta 772 MHz:n, varjostinyksiköt toimiva 1544 MHz taajuudella ja muisti 1002 Mhz taajuudella (mikä tarkoittaa käytännössä 4008 MT/s datanopeutta). GTX 580 tarjoaa siis suurin piirtein sellaisia ominaisuuksia, kun aikaisemmin tänä vuonna odotettiin. Se sisältää kokonaisuudessaan 512 CUDA-ydintä, 64-teksturointiyksikköä ja 16 PolyMorph-moottoria.

Piirrin back-end-osat näyttävät laatikkodiagrammissa suunnilleen samoilta, ainoana erona on muistin nopeampi kellotaajuus. Se sisältää edelleen kuusi ROP-osiota, jokainen 64-bittisen muistiväylän jatkeena (yhteenlaskettu väylän leveys on 384 bittiä). Jokainen osio kykenee tuottamaan kahdeksan 32-bittistä kokonaislukupikseliä kerrallaan, eli yhteensä 48 pikseliä kellojaksoa kohti.

Kertomuksia tesselaatiosta

Geometriasta on yhtäkkiä tullut erittäin puhuttu aihealue. Kun Nvidia esitteli Fermi-arkkitehtuuria ensimmäistä kertaa, DirectX 11 ja tesselaatio nousivat esiin yhä uudestaan. Nvidia rakensi yhden PolyMorph-moottorin jokaiseen Shader Multiprocessor –yksikköön. Sen piti oletettavasti lisätä valtavasti suorituskykyä niissä peleissä, joissa tesselaatiota käytetään realismin parantamiseen. Ongelmana oli kuitenkin se, ettei siihen aikaan ollut olemassa pelejä joiden avulla tesseelaatiota olisi voinut esitellä. Toki DiRT 2 ja Alien vs. Predator oli julkaistu, mutta ne ovat molemmat ”ensimmäisen sukupolven” DirectX 11 –pelejä, jotka käyttävät geometriaa hyvin valikoivasti (eikä kumpikaan onnistunut antamaan näyttöä Nvidian väitteille, että geometrian lisääminen on pelialan tulevaisuus).



Niiden lisäksi on vielä HAWX 2. Se itse asiassa julkaistaan vasta GeForce GTX 580 –kortin jälkeen, mutta saimme yhden kopion testauskäyttöä varten jo muutama päivä sitten. Päätimme ottaa sen mukaan testivalikoimaan, kuten aikanaan alkuperäinen HAWX oli. HAWX 2 on kiistelty peli, sillä AMD:n mielestä siinä käytetyn tesseloinnin suhde on epärealistisen suuri, mikä rajoittaa AMD:n korttien suorituskykyä. AMD on ilmoittanut, että se yrittää saada peliin mukaan paikkauksen, joka sen mielestä parantaisi geometrian toteutusta. Siitä riippumatta aiomme testata nykyisillä tiedoilla, sillä se on myös pelaajia odottava kokemus, kunhan pelin toimitukset alkavat.

Käytämme edelleen Unigine Heaven –testiä mittaamaan kunkin arkkitehtuurin skaalautuvuutta geometrian määrän kasvaessa.







Vaikka AMD:n mielestä sen lähestymistapa tesselointiin onkin se oikea, on kuitenkin selvästi havaittavissa, että Nvidian versio säilyttää suorituskykynsä paremmin geometrian monimutkaisuuden lisääntyessä. Ylimääräinen SM (ja PolyMorp-moottori) yhdistettynä korkeampaan kellotaajuuteen antaa GeForce GTX 580:lle kohtuullisen selvän eron GTX 480:n verrattuna kun tesselaatio on asetettu Extreme-tasolle. Radeon HD 5870 ei pysy edes Nvidian GeForce GTX 470:n perässä kun monimutkaisuutta kasvatetaan.

Mielenkiintoinen yksityiskohta on myös se, että AMD:n Radeon HD 6870 päihittää teknisesti paremman 5870-mallin. AMD:n mukaan tesselaatio oli yksi painopisteistä Barts-piiriä kehitettäessä ja huolimatta sen pienemmästä määrästä varjostimia, uudempi kortti pärjää tosiaan paremmin (ja korkeammalla vähimmäisruudunpäivityksellä).

Kommentoi artikkelia