User Tools

Site Tools


hpc-cluster:r

This is an old revision of the document!


R ist auf dem Cluster installiert und verwendbar. Ein Vorteil des Clusters ist insbesondere die Möglichkeit, Berechnungen parallel durchzuführen. Dazu sind verschiedene Bibliotheken verfügbar.

Rmpi

Wenn man das Paket Rmpi direkt verwenden will, ist man selbst für die Verteilung der Jobs an die “Slaves” verantwortlich. Außerdem benötigt man ein Skript in beim Start von R dafür sorgt, dass die Slaves verfügbar sind. Das wird meist über eine Datei .Rprofile erreicht, die im Arbeitsverzeichnis oder im Homeverzeichnis liegen muss.

Mögliche Arten, die .Rprofile einzubinden:

  • .Rprofile im Arbeitsverzeichnis wird vom Jobskript für jeden Job extra hinkopiert (z.B. mit cp ~/R/x86_64-unknown-linux-gnu-library/2.15/Rmpi/Rprofile ./.Rprofile)
  • .Rprofile im Homeverzeichnis des Users
  • Die Umgebungsvariable R_PROFILE setzen, sie kann auf eine beliebige Datei verweisen, die als .Rprofile genutzt wird. Die Umgebungsvariable kann im Jobfile, in der .bashrc oder in einem Modulefile gesetzt werden.

dompi

Mit dem Paket dompi kann man z.B. foreach-Schleifen einfach mit dem Zusatz %dopar% parallelisieren. Damit die Slaves hier richtig gestartet werden, darf es aber gerade keine .Rprofile geben.

hpc-cluster/r.1347624330.txt.gz · Last modified: 2012/09/14 12:05 by jantha