이슈를 작성하게 된 계기
Network Operator 사용법을 질문함
1. RDMA 디바이스를 사용하려는 파드에 resource를 추가해야함 --> rdma/rdma_shared_device_a: 1 (값은 1개만 지정하면 됨)
2. multus + macvlan cni를 사용해 network-attachment-definitions CRD를 생성 후 파드에 annotation를 추가해야함 --> k8s.v1.cni.cncf.io/networks: rdma-net-ipam
도큐먼트를 참고하여 파드 스펙을 다시 작성함
이슈 링크
Error creating new device · Issue #108 · Mellanox/k8s-rdma-shared-dev-plugin
Hello, I have installed the network-operator based on the following values.yaml. deployCR: true rdmaSharedDevicePlugin: deploy: true resources: - name: rdma_shared_device_a vendors: ["15b3"] device...
'깃' 카테고리의 다른 글
[깃] 이슈 정리: NCCL Error on Multi-Node Training with Mixed GPU Setup (1) | 2024.07.24 |
[깃] 이슈 정리: Copy License not working (0) | 2024.06.05 |
[깃] 이슈 정리: Numpy reader test (GDS) (0) | 2024.05.30 |
[깃] 이슈 정리: main_process_ip not working (0) | 2024.05.30 |
[깃] 이슈 정리: How to use multiple HCA? (0) | 2024.05.30 |