2017. 11. 8. 10:14 나의일 관련/클러스터관리툴
SLURM 공부 기록
[slurm 계산 노드 정보 ]
- parririon 정보 확인
$ sinfo |
- 상세 자원 정보 출력
$ sinfo -N -l |
- sinfo 사용 참고 : https://slurm.schedmd.com/sinfo.html
[작업 제출]
sbatch 명령을 이용하여 slurm 스케줄러로 작업 제출
$ sbatch run.sh |
[작업 조회]
squeue 명령을 이용하여 작업 조회
$ squeue |
* R : RUNNING 상태
* PD : PENDING 상태
* S : SUSPENDED 상태
* ST : STOP 상태
* CD : COMPLETED 상태
* CA : CANCELLED 상태
* F : FAILED 상태
* NF : NODE_FAIL 상태
- 참고 : https://slurm.schedmd.com/squeue.html
[작업 정보 조회]
sacct -j {작업ID} --format {포멧지정}
sacct -j 1902 --format JobID,jobname,NTasks,nodelist,MaxRSS,MaxVMSize,AveRSS,AveVMSize
[수행 중인 작업 정보 조회]
sstat -j {작업ID} --format {포멧지정}
sstat -j 1902 --format JobID,jobname,nodelist,MaxVMSize,MaxRSS,MaxDiskRead,MaxDiskWrite
$ scontrol show job 1902 |
'나의일 관련 > 클러스터관리툴' 카테고리의 다른 글
오류 내용 : ld: cannot find -lfl (0) | 2018.01.08 |
---|---|
linux 유용한 스크립트 기록 (0) | 2017.11.16 |
PBS Pro stack size 조정 기록 (0) | 2017.11.13 |
PBS Pro 사용자의 작업 제출 허용 기록 (0) | 2017.11.02 |
redhat 계열 repo 파일 생성 (0) | 2017.10.27 |