Core i7-4770K: Esikatsaus Haswellin suorituskykyyn

Artikkelin kirjoittaja: Chris Angelini Artikkelin suomentaja: Teemu Laitila

Testitulokset: Sandra 2013




Vaikka Dhrystone-testi ei välttämättä edusta täysin totuudenmukaisesti tosielämän käyttöskenaarioita, AVX2-käskykantaa tukevien sovellusten puutteessa joudumme käyttämään SiSoftwaren testiä selvittämään, millainen vaikutus uudella käskykannalla on yleiseen kokonaislukusuorituskykyyn, kun sovellukset on kunnolla optimoitu sen hyödyntämiseen.

Whetstone-testi puolestaan hyödyntää SSE3-käskykantaa, joten Haswellin muutokset Ivy Bridgeen nähden ovat vähittäisempiä.



Sandran multimediatesti generoi 640x480 pikselin kokoisen kuvan Mandelbrotin joukosta käytäen 255 iteraatiota pikseliä kohti, millä pyritään simuloimaan vektoroitua koodia, joka toimii niin täydellisen rinnakkaisesti kuin mahdollista.

Kokonaislukutestissä käytetään AVX2-käskykantaa, jota Intelin Haswell-pohjainen Core i7-4770K tukee, kun taas Ivy Bridge - ja Sandy Bridge -tukevat vain aiempaa AVX-kantaa. Kuten taulukon punainen palkki näyttää, Haswell suoriutuu tehtävästä lähes tuplasti nopeammin.

Myös liukulukuoperaatioiden suorituskyky kasvaa merkittävästi Intelin FMA3-implementaation ansiosta (AMD:n Bulldozer tukee FMA4-tekniikkaa kun Piledriver tukee sekä kolmen että neljän kohdemuuttujan versiota). Ivy Bride - ja Sandy Bridge -pohjaiset prosessorit käyttävät AVS-pohjaista koodia ja ne jäävät kohtalaisen paljon jälkeen samalla kellotaajuudella.

Miksi double-tyyppiset laskut nopeutuvat Haswellilla niin paljon verrattuna liukulukuihin? FMA3:n suorituskyky on itse asiassa kiinni latensseista. Jos FMA3-tuki poistettaisiin käytöstä Sandrasssa ja sen tilalla käytettäisiin AVX:ää, tulokset skaalautuisivat samaan tapaan.



Kaikki kolme prosessoria sisältävät tuen AES-NI-tekniikalle ja jo aiempien testien perusteella tiedämme, että koska Sandra pyörii puhtaasti laitteistopohjaisena, prosessorit käsittelevät ohjeita samaan tahtiin kuin niitä lähetetään muistista. Core i7-4770K jää lievästi alakynteen AES256-testissä, mikä kertoo muistikaistan pienemmästä kokonaisnopeudesta. Olisin kuitenkin taipuvainen laskemaan hitauden sen piikkiin, että testin Haswell-piiri ei ole vielä täysin valmis.

SHA2-256-suorituskyky sen sijaan riippuu vain kunkin ytimen laskentatehosta. Haswellin parantunut IPC-suorituskyky auttaa sen ohi Ivy Bridge -verrokistaan, joka puolestaan on nopeampi kuin edeltäjänsä Sandy Bridge.



Muistikaistan mittaaminen vahvistaa AES256-testin epäilyt. Kaikki kolme testialustaa toimivat 1600 MT/s nopeudella, mutta Haswell vaikuttaisi olevan vielä viimeisiä säätöjä vailla.



Intel kertoi jo viime vuoden IDF-tapahtumassa, että Haswellin muistihierarkia on optimoitu suorituskykyä silmällä pitäen. Kuten odottaa saattaa, Sandran välimuistin kaistaa mittaava testi paljastaa suorituskyvyn lähes kaksinkertaistuneen 23 kilotavun L1-välimuistissa.

Silti L2-välimuistin parannukset ovat itse asiassa merkittävästi pienempiä ja odotimme myös sen nopeuden parantuvan lähelle kaksinkertaista, ottaen huomioon 64 tavua / jakso kokonaisnopeuden (L2-välimuistin pitäisi teoriassa pystyä yli 900 GB/s nopeuteen). L3-välimuistin nopeus jopa tipahtaa hieman, mikä saattaa liittyä sen siirtämiseen omalle kelloalueelleen.

Näiden tulosten perusteella on hankala sanoa, onko testissä käytetyssä Engineering Sample -piirissä jotain vikaa, vai vaatiiko prosessori vielä muita säätöjä. Joka tapauksessa näiden tulosten perusteella ei voi vielä tehdä erityisen pitkälle meneviä päätelmiä.

Kommentoi artikkelia