나의일 관련/클러스터관리툴
SLURM 공부 기록
천연사이다
2017. 11. 8. 10:14
[slurm 계산 노드 정보 ]
- parririon 정보 확인
$ sinfo |
- 상세 자원 정보 출력
$ sinfo -N -l |
- sinfo 사용 참고 : https://slurm.schedmd.com/sinfo.html
[작업 제출]
sbatch 명령을 이용하여 slurm 스케줄러로 작업 제출
$ sbatch run.sh |
[작업 조회]
squeue 명령을 이용하여 작업 조회
$ squeue |
* R : RUNNING 상태
* PD : PENDING 상태
* S : SUSPENDED 상태
* ST : STOP 상태
* CD : COMPLETED 상태
* CA : CANCELLED 상태
* F : FAILED 상태
* NF : NODE_FAIL 상태
- 참고 : https://slurm.schedmd.com/squeue.html
[작업 정보 조회]
sacct -j {작업ID} --format {포멧지정}
sacct -j 1902 --format JobID,jobname,NTasks,nodelist,MaxRSS,MaxVMSize,AveRSS,AveVMSize
[수행 중인 작업 정보 조회]
sstat -j {작업ID} --format {포멧지정}
sstat -j 1902 --format JobID,jobname,nodelist,MaxVMSize,MaxRSS,MaxDiskRead,MaxDiskWrite
$ scontrol show job 1902 |