Einstein allein zu Haus

Re: dürfte ich auf ...

Avatar von TETSUO_Berlin

TETSUO_Berlin

mehr als 1000 Beiträge seit 12.08.2004

   E-Mail   
10.11.2012 03:09 Permalink
Stephan Goll schrieb am 23. Oktober 2012 12:34

> ... http://albert.phys.uwm.edu/forum_thread.php?id=8950 hinweisen?
gelesen und mir erstmal meinen teil dabei gedacht gehabt ... mir fiel
beinahe spontan was dazu ein, aber irgendwie wollt oder durft oder
konnt ich nich tipp0rn. edith hätt bestimmt geschimpft ...

> Ich hab mir 'n paar Gedanken gemacht und die mal formuliert. Da hier
> 'n paar Leute ebenfalls auf den GraKas rechnen lassen würde ich diese
> auch um ihre Ideen bitten. Speziell zu Windows kann ich leider
> garnichts sagen, allerdings nutzt der Ziegenmelker(?) doch wohl
> erfolgreich mehrere e@h-Tasks unter Linux parallel. Mich würde mal
> interessieren, was da lsmod sagt bzw. wieviele Kerne da genutzt
> werden.
> Stephan

wenn ich das cuda-prinzip* so verstanden habe, dass eine aufgabe
einen befehl oder mehrererere verarbeiten kann, dann wäre eine
pipeline mit mehr als einem core zur nutzung zweckreich. wie beim
assembler hast du auch dort so basic-operationen: öffnen, laden,
ablegen, umbewegen, verdoppeln, quadrieren, wurzeln und so weiter,
als minimum zur nutzung.

wenn diese geschickt - und darin liegt des pudels kern** - angestellt
wird, können die daten streamen und dafür könnt ich mir gut und gern
4+x kerne vorstellen. in den pdf´s stand was von 8er blöcken, also
bleibt ein wenig verschnitt oder ich hab eben einfach zu wenig plan
davon im augenblick, jedenfalls lasssen sich cluster bilden 4x4 oder
16x16 beispielsweise, die dann ein oder mehrere aufgaben gleichzeitig
erfüllen. eventuell brauch man auch einen oder n blöcke für eine
aufgabe, das hängt wohl mit der aufgabenstellung zusammen, um einen
job/task/funktion/prozess*** darzustellen.

wenns denn streaming iss, was man da hingebogen bekommt, dann liegts
wohl tatsächlich an der soften architektur, wie gescheit man die
verschiedenen gpus ausreizen kann und wie der wirkungsgrad dann
letztendlich ausfällt. die einstein oder albert-app macht doch
schonmal n guten eindruck, die aufgabenstellung in software zu
modellieren, unter betrachtung der zur verfügung stehenden hardware,
läßt bei der vielfalt viel platz, eventuell auch verschnitt.

da es vermutlich in c gemacht ist, und nicht in java****, wirst du
evendudel selbst was frickeln können. eclipse juno is wieder so
halbwegs brauchbar, wenn dir der vim oder emacs zu wenig mitteilen ;)

grüße nach sonstawo
TET

* intro - atomic operations : page 48
> http://www.nvidia.com/content/cudazone/download/Getting_Started_w_CUDA_Training_NVISION08.pdf

** redensart - des pudels kern 
> http://www.redensarten-index.de/suche.php?suchbegriff=~~des%20Pudels%20Kern&bool=relevanz&suchspalte[]=rart_ou

*** architecture - 32,48,192 cores : page 157,161
> http://developer.download.nvidia.com/compute/DevZone/docs/html/C/doc/CUDA_C_Programming_Guide.pdf

**** rootbeer - java for gpu accessibility
> https://github.com/pcpratts/rootbeer1

Thread-Anzeige einblenden

Anzeige

heise online Themen