SIONlib, partest: segfault bei 1011 MB total data size / task
Christoph Rakwitz, HPC Gruppe, RWTH rackwitz@rz.rwth-aachen.de
Hallo,
Dieter an Mey schickt mich. Ich soll mir die SIONlib anschauen und bin auf ein Problem gestossen.
Ich habe die SIONlib nach Doku entpackt, kompiliert und installiert.
Nun probiere ich partest mit 3/4/5/8 Prozessen auszufuehren. Wenn ich jeden Prozess 1010 MB schreiben lasse (-S), laeuft das Programm. Verlange ich 1011 MB, gibt es einen Segfault.
Der Segfault passiert aber erst beim Lesen; Schreiben klappte bisher immer, egal wieviel (also auch ueber 4 GB).
Beispiel: $ mpiexec -np 8 -m 1 partest -f $WORK/partest_parfile.dat -X 1 -v -d -D -S 1011
Ich habe verschiedene Dateisysteme auf dem RWTH Cluster ausprobiert: mein $HOME, ein $WORK (vermutlich Lustre) und ein explizites Lustre. Das Verhalten zeigt sich auf allen diesen.