ASRock E350M1: AMD:n Brazos saapuu työpöydille

Artikkelin kirjoittaja: Teemu Laitila | 0 kommenttia

Toinen aavistus: Videon transkoodaus


Jos rehellisiä ollaan, sujuva videotoisto ei tule ensimmäisenä mieleen, kun puhutaan CPU:n ja GPU:n yhdistämisestä samalle sirulle. Näkisimme mielellämme hieman vakuuttavampia esimerkkejä siitä, mitä kahden aiemmin erillisen maailman yhdistäminen rinnakkaiseen työskentelyyn kykeneväksi yksiköksi mahdollistaa. Videon transkoodaus lienee täydellinen testi.
Ikävä kyllä Intel latisti pahasti AMD:n tulosten uutuudenviehätystä esittelemällä Quick Sync –ominaisuuden, joka on nimenomaan suunniteltu videon purkamiseen ja pakkaamiseen. Quick Sync löytyy Sandy Bridge –prosessoreiden vähävirtaisimmista malleista, joiden TDP yltää jo niin alas kuin 17 wattiin. Quick Synciä ei kuitenkaan saa halvalla, sillä jopa halvinkin (Intelin Core i5-2537M) malli maksaa 250 dollaria. Sen suorituskyky videon osalta on kuitenkin erittäin vakuuttavaa. Toisaalta taas kokonaisen Brazos-pohjaisen netbook/nettop-koneen saa alle 500 dollarilla. Pelkkiä Brazos-pohjaisia emolevyjä, joihin prosessori on juotettu kiinni, saa jo alle 100 dollarin hintaan. Zacaten vertaaminen Sandy Bridgeen ei siis ole erityisen reilua.

Halvemman hintaluokan koneissa joudutaan siis tekemään kompromisseja videon transkoodausnopeuden suhteen. Transkoodauksen prosessissa aluksi luetaan tiedosto, puretaan se, pakataan uudelleen ja esitetään. AMD:n Zacate-APU luonnollisesti saa apuja purkuvaiheessa. Sen jälkeen se hyötyy CPU:n ja GPU:n läheisyydestä, mikä nopeuttaa datan kopiointia grafiikkamuistista prosessorille. AMD kutsuu tätä ominaisuutta Fast Copy Optimization –nimellä.



Sen toimintaperiaate on yksinkertainen. Aiemmin transkoodauksessa käytettiin prosessorikäskyjä kopioimaan purettua videodataa PCI Express –väylän päässä sijaitsevalta näytönohjaimelta prosessorille, jossa tapahtui jälkikäsittely ja pakkaaminen. Tämä kahden eri muistin välillä tapahtuva prosessi kulutti turhia prosessorisyklejä. Se ei ole ongelma moderneille työpöytäprosessoreille eikä siitä aiheudu erityisen suurta pullonkaulaa. Mobiilimmissa kokoonpanoissa turhat prosessorisyklit eivät pelkästään rajoita suorituskykyä, vaan niillä on myös negatiivinen vaikutus tehonkulutukseen. Fast Copy parantaa DMA:ta, joka kykenee kopioimaan samaa dataa ilman, että käytetään ylimääräisiä prosessorisyklejä, mikä vapauttaa kaksi Bobcat-ydintä hoitamaan pelkästään pakkausprosessia.

Niin mitä? Pakkaaminen tapahtuu prosessorissa? Meillä on 80 stream-prosessoria kahdessa SIMD-moottorissa, miksei niille sälytetä laskentaa samaan tapaan, kuin Intel käytti EU:ita Sandy Bridge –arkkitehtuurissa? AMD:n erillisissä näytönohjaimissahan on kuitenkin tuki videon pakkaukselle? Zacaten kaksi SIMD-moottoria eivät kuitenkaan ole tarpeeksi tehokkaita, jotta niiden käyttämisellä saataisiin erityistä hyötyä. Tämä tekniikka on kuitenkin tulossa myöhemmin Sabine-alustan ja Llano APU:iden myötä, joten meidän täytyy odottaa siihen asti, että näemme kuinka hyvin se toimii.

Sillä välin ArcSoft , joka on yksi CyberLinkin kilpailijoista, on työstämässä omaa OpenCL-pohjaista pakkausmetodia, joka saattaa muuttaa tai saattaa olla muuttamatta Brazos-alustan suorituskykylukemia lähitulevaisuudessa. Myös CyberLink suunnittelee OpenCL-tekniikan käyttöä myöhemmin tänä vuonna. Mutta molemmat yhtiöt keskittynevät kuitenkin pääosin Llanoon, josta löytyy tarpeeksi GPU-muskelia, jotta videonpakkausta on kannattavaa hoitaa GPU:n avulla.

Kommentoi artikkelia