Gereedskap |
CUDACUDA (Afkorting in Engels vir:"Compute Unified Device Architecture") is `n tegnologie om algoritmes te skryf, wat op die beeld verwerkingseenheid (BVE) hardloop, in die C programmeringstaal. Dit verskil van die normale GPGPU metodes wat die grafikakaart se drywers gebruik om in saamsteltaal algoritmes te skryf. CUDA is ontwikkel deur Nvidia vir hulle Geforce 8 reeks, Tesla 870 en hul Quadro reeks. Nvidia sê dat hulle dit gaan implementeer in al hulle toekomende beeld verwerkingseenhede. Die CUDA sdk en drywers is op die 15 Februarie vrygestel. Die huidige weergawe van die SDK en drywers is 2.0 Beta2.
[wysig] Voordele
[wysig] Hardeware benodigCUDA kan slegs hardloop op sekere BVE's wat CUDA bevat nl. die Geforce 8 reeks. Alle nuwe BVE's wat Nvidia maak sal CUDA ingebou hê sonder enige veranderings aan die funksies wat hy dien, dus gaan net optimalisering plaasvind en programmeerders sal versekerd wees dat hul programme op alle vorige en toekomende BVE's sal werk.
[wysig] PhysxNvidia het vir Ageia oorgekoop in vroeg 2008 om hul Physx enjin oor te skryf om met CUDA op die BVE te hardloop. Dit beteken dat alle rekenaar speletjies wat die Physx aandrywer bevat, sal dan deur die BVE versnel word sonder enige verandering aan die speletjie se kode. Volgens Nvidia is die proses om Physx enjin oor te skryf, amper klaar. Die spoed waarteen die projek voltooi gaan word, is `n aanduiding van hoe maklik dit is om met CUDA te programmeer. Nvidia het `n demonstrasie gehou met die Physx enjin wat 60 000 partikels simuleer. Volgens chw.net sal die drywers in Augustus aan die publiek vrygestel wees, wanneer die drywers sy WHQL-sertifikaat kry. OpenGL 3.0 sal ook saam met hierdie drywers vrygelaat word. ngohq.com het die physx enjin geskryf om ook op ATI BVE's te hardloop, Nvidia het vir hulle alle nodige sagteware en hulp vir hulle gegee. [wysig] Spoed Voordeel teenoor SVE'sDaar is geen spoed voordeel of nadeel van CUDA en ander GPGPU tegnologie nie, maar wanneer mens dit vergelyk met die spoed van die SVE is die CUDA implementasie 15 tot 20 keer die spoed van `n gedemonstreerde Intel Nehalem SVE wat teen 3.2 GHZ hardloop met 4 kerns. Die Intel demonstrasie het gewys hoe hy 50 000 tot 60 000 partikels simuleer teen 15-20 RPS (rame per sekonde), by `n later demonstrasie deur Nvidia het hulle `n soortgelyke partikel simulasie met dieselfde aantal partikels gewys wat teen 300 RPS hardloop. Die spoed voordeel kom van om die groot aantal stroom verwerkers en baie drade te gebruik om in parallel die simulasie kalkulasies te doen. `n SVE is optimaliseer om so min as moontlik vertraging met geheue skrywings en lesings te hê om so vinnig as moontlik `n enkele draad te voltooi, waar `n BVE optimaliseer is om `n groot aantal ander drade te voltooi terwyl hy wag vir sy stadiger geheue om te skryf of te lees. |