AMD FX-8150: Bulldozerista Zambeziin ja FX:n

Artikkelin kirjoittaja: Teemu Laitila | 0 kommenttia

Tehonkulutus ja sen hallinta


Jokainen Bulldozer-moduuli kuuluu omaan kellotaajuusalueeseensa, eli eri moduulit voivat toimia eri kellotaajuuksilla samaan aikaan. Tämä on uusi tilanne verrattuna Phenom II:n, joskin AMD kokeili tekniikkaa jo alkuperäisen Phenomin tapauksessa.

Jos muistat niinkin kaukaisia asioita, niin eri kellotaajuudet aiheuttivat ongelmia Windows Vistan ja alkuperäisten Phenomien tapauksessa, kun Cool'n'Quiet-tekniikka oli käytössä. Kulkeutumiseksi (migration) kutsutun prosessin avulla käyttöjärjestelmän ajastin siirteli säikeitä ytimeltä toiselle tarkoituksenaan säilyttää symmetrisyys kuormituksessa. Miksi? Asiaa selitetään vanhassa Intelin Lynnfield-prosessoreiden julkaisuartikkeleissa:

"Jos halutaan säilyttää järjestelmän symmetrisyys kuormituksessa, I/O-toimintojen ei kannata antaa muodostua riippuvaiseksi vain yhden ytimen toiminnasta. Jos säikeitä kierrätetään ytimien välillä, jotka toimivat kaikki täydellä teholla (koko konsepti hajoaa, jos ytimiä aletaan sammutella), järjestelmä pysyy paremmin vastaamaan käskyihin.

Säikeiden hajauttamisessa on kyse Microsoftin vanhasta suunnitteluratkaisusta, joka toteutettiin jo Windows NT:n kerneliä suunnitellessa ja perustuen kokemuksiimme molempien valmistajien prosessoreiden kanssa, sitä ei pidetty kummallekaan valmistajalle suunnattuna ominaisuutena. Se kuitenkin vaikuttaa Inteliin hyvin eri tavalla kuin AMD:hen. Intelin ongelma Vistan kanssa johtuivat tehonkulutuksesta. Jokaisen migraation yhteydessä Nehalem-arkkitehtuurin L3-välimuisti piti yhdistää uudelleen, mikä aiheuttaa tehonkulutusta.

Tilanne muuttuu Windows 7:n kohdalla ja uutta ominaisuutta kutsutaan "ideaaliseksi ytimeksi". Se tarkoittaa, että jos tehtävän kaikki tarpeet hoituvat yhden ytimen avulla, säiettä ei siirretä muualla pelkän siirtämisen takia. Tämä vaikuttaa Inteliin kahdella tapaa: ensiksikin migraatioon ei tarvitse kuluttaa ylimääräistä tehoa ja toiseksi toimettomat ytimet voivat pysytellä C6-tilassa. Pelkällä migraation korjaamisella yritetään saada Nehalem-pohjaisten kannettavien akkukestoa parannettua ylimääräisellä 10 - 15 minuutilla, vaikka vaikutuksia ei juuri nähdä ennen kaksiytimisten Arrandale-pohjaisten kannettavien saapumista. Mielenkiintoisempi yksityiskohta on kuitenkin se, että prosessorit jotka eivät tue C6-tilaa eivät hyödy uudistuksesta (sisältäen AMD:n CPU:t). "


Joten vaikka Phenomit saattoivat olla hieman aikaansa edellä ottaen huomioon Vistan ajoittimen, Windows 7:n pitäisi kyetä hyödyntämään AMD:n arkkitehtuuria tehokkaammin. Mutta Zambezista, Interlagosista ja Valenciasta vastaavan insinöörin Larry Hewittin mukaan Bulldozer kykenee käynnistymään pienimmästä mahdollisesta p-tilastaan vielä nopeammin kuin Phenomit.



Halusimme tietysti testata Larryn väitteen. Vaikka yllä oleva kuvaaja ei sitä kerrokaan, Phenom II, joka korjasi Phenomin ongelmat ajamalla kaikkia ytimiä samalla nopeudella, ei suorituskykynsä puolesta eroa muista PCMark 7 -testissä riippumatta siitä onko Cool'nQuiet käytössä. Sama pätee myös FX-8150:n, mikä vahvistaa sen, että Zambezi ja Windows 7 käyttäytyvät kuten pitääkin. Huomionarvoista on kuitenkin se, miten tehokkaita AMD:n Bulldozeriin tekemät tehonkulutukseen liittyvät optimoinnit ovat. Siniset ja vihreät viivat esittävät FX- ja Phenom II X6 -prosessoreita kun Cool'nQuiet on käytössä. Musta ja punainen esittävät samoja malleja ilman CnQ-tekniikkaa.

Tulosten perusteella Phenom II X6 kuluttaa keskimäärin 204 wattia ilman CnQ-tekniikaa ja 191 wattia kun Cool'n'Quiet on käytössä, mikä tarkoittaa 13 watin eroa. FX-8150 kuluttaa saman 191 wattia kun CnQ on käytössä, mutta kulutus hyppää 240 wattiin ilman virransäästöä. CnQ vähentää tehonkulutusta keskimäärin hämmästyttävät 49 wattia testiajon aikana ilman, että se vaikuttaa suorituskykyyn negatiivisesti!

Integroitu northbridge ja L3-välimuisti ovat omalla kelloalueellaan. Lisäksi sillä on myös oma tehoalueensa. Intel toi Power gating -tekniikan ensimmäiseksi Nehalem-suorittimiinsa, mutta AMD käytti sitä ensimmäisen kerran vasta Llanon-suunnittelussa. Bulldozerissa power gating on otettu tehokkaaseen käyttöön, mikä minimoi vuotovirran kun osa sirusta on sammutettuna.

Kuten myös Llanossa, Zambezi/Valencia/Interlagos-pohjaiset sirut tukevat Core C6 -tilaa, jossa Bulldozerin muisti tyhjennetään, tarvittavat tiedot tallennetaan järjestelmän muistiin ja jännite poistetaan kokonaan. Sen tuloksena jokaisen nukkumaan laitetun moduulin tehonkulutus ja lämmöntuotto putoavat dramaattisesti. Siitä on erityisen paljon hyötyä Windows 7:n tapauksessa, jota aiemmin käsiteltiin. Windows 7 antaa toimettomien moduulien pysytellä lepotilassa pidempään (se kuitenkin pätee vai moduulitasolla eikä ytimien tapauksessa).

C1E tuki ei ole AMD:lle uusi asia, mutta sitä on paranneltu osittain. Kaikki Bulldozer-moduulit voidaan sammuttaa, kun nortbridge, HyperTransport-väylä ja DRAM siirtyvät hyvin matalan tehonkulutuksen tilaan.

Kommentoi artikkelia