프로그램 사용/openHPC
slurmd: fatal: Unable to determine this slurmd's NodeName
2020. 12. 15. 12:06
예제에서 컴퓨트 노드를 c1 이런식으로 이름을 지어놨는데
openhpc-로 접두를 바꾸면서 생기는 문제
에러 그대로 NodeName을 판별할 수 없다는데
아래 경로의 파일을 수정해주면 문제없이 된다.
cp /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf.ohpc /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf vi /opt/ohpc/admin/images/centos8.2/etc/slurm/slurm.conf NodeName=openhpc-[1-2] Sockets=2 CoresPerSocket=8 ThreadsPerCore=2 State=UNKNOWN
도대체 머가 문제일까...
# slurmd -v slurmd: fatal: Unable to determine this slurmd's NodeName # slurmd -V slurm 20.02.5 # slurmd -C NodeName=openhpc-1 CPUs=1 Boards=1 SocketsPerBoard=1 CoresPerSocket=1 ThreadsPerCore=1 RealMemory=968 UpTime=0-00:30:27 |
[링크 : https://www.raspberrypi.org/forums/viewtopic.php?t=245429]
[링크 : https://serverfault.com/questions/988027/slurm-service-running-failed-again-i-dont-know-why]