이전 포스팅에서 이어짐 CSI 드라이버 설치가 끝났으면 StorageClass와 PersistentVolumeClaim를 생성해서 사용하면 되며, 현재 경로는 csi-powerscale이라고 가정함 1. StorageClass 생성 samples/storageclass/isilon.yaml을 참고하여 생성하면 되는데 주의할 점은 parameters 중 IsiPath에 들어가는 경로의 권한은 직접 스토리지 서버로 들어가서 IsiVolumePathPermissions에 적힌 권한을 수용할 수 있는 권한으로 설정해야함 (IsiVolumePathPermissions의 디폴트 값은 0777) apiVersion: storage.k8s.io/v1 kind: StorageClass metadata: name: isi..
환경 - Infiniband 드라이버 설치 --> 참고 - OS 및 GPU 드라이버에 맞는 CUDA toolkit 설치 --> 참고 - Accelerate로 실행 가능한 pytorch 학습 파일 (train.py) --> 참고 - NCCL 및 HPC-X 설치 (HPC-X 압축해제 후 경로를 HPCX_HOME 환경변수에 등록) - pdsh 설치 및 아래 라이브러리 설치 --extra-index-url https://download.pytorch.org/whl/cu118 torch==2.0.1 transformers==4.33.1 evaluate==0.4.0 scikit-learn==1.2.2 accelerate==0.20.3 sentencepiece==0.1.99 protobuf==4.24.0 - Deep..