2017. 11. 8. 10:14 나의일 관련/클러스터관리툴
SLURM 공부 기록
[slurm 계산 노드 정보 ]
- parririon 정보 확인
| $ sinfo | 
- 상세 자원 정보 출력
| $ sinfo -N -l | 
- sinfo 사용 참고 : https://slurm.schedmd.com/sinfo.html
[작업 제출]
sbatch 명령을 이용하여 slurm 스케줄러로 작업 제출
| $ sbatch run.sh | 
[작업 조회]
squeue 명령을 이용하여 작업 조회
| $ squeue | 
* R : RUNNING 상태
* PD : PENDING 상태
* S : SUSPENDED 상태
* ST : STOP 상태
* CD : COMPLETED 상태
* CA : CANCELLED 상태
* F : FAILED 상태
* NF : NODE_FAIL 상태
- 참고 : https://slurm.schedmd.com/squeue.html
[작업 정보 조회]
sacct -j {작업ID} --format {포멧지정}
sacct -j 1902 --format JobID,jobname,NTasks,nodelist,MaxRSS,MaxVMSize,AveRSS,AveVMSize
[수행 중인 작업 정보 조회]
sstat -j {작업ID} --format {포멧지정}
sstat -j 1902 --format JobID,jobname,nodelist,MaxVMSize,MaxRSS,MaxDiskRead,MaxDiskWrite
| $ scontrol show job 1902 | 
'나의일 관련 > 클러스터관리툴' 카테고리의 다른 글
| 오류 내용 : ld: cannot find -lfl (0) | 2018.01.08 | 
|---|---|
| linux 유용한 스크립트 기록 (0) | 2017.11.16 | 
| PBS Pro stack size 조정 기록 (0) | 2017.11.13 | 
| PBS Pro 사용자의 작업 제출 허용 기록 (0) | 2017.11.02 | 
| redhat 계열 repo 파일 생성 (0) | 2017.10.27 |