방법 1. config 수정 1. openssh-server가 설치되어있고 /etc/ssh/sshd_config를 수정하지 않았다면 아래 명령어로 수정 가능 sed -i 's/^#Port 22$/Port {target_port}/' /etc/ssh/sshd_config 2. 컨테이너 실행 시 아래 커맨드를 docker-compose.yaml에 포함시키면 됨 "command": [ "/bin/bash", "-c", "sed -i 's/^#Port 22$/Port {target_port}/' /etc/ssh/sshd_config && /usr/sbin/sshd && sleep infinity", ] 방법 2. ssh 실행 시 포트 지정 1. 컨테이너 실행 시 아래 커맨드를 docker-compose.yaml..
문제 상황 linkerd의 도큐먼트를 따라 linkerd-viz 및 grafana를 설치 후 linkerd-viz 대시보드에서 grafana 아이콘이 뜨는 것을 확인했지만 막상 grafana를 열어보면 메트릭들이 N/A만 나오는 상황 linkerd-prometheus의 로그를 확인 시 unauthorized connection on server proxy-admin라고 나옴 해결 아래의 리소스를 추가해주니 해결됨 apiVersion: policy.linkerd.io/v1beta1 kind: ServerAuthorization metadata: name: yolo namespace: linkerd-viz spec: client: unauthenticated: true networks: - cidr: 0.0..
문제 상황학습 시작 시 아래와 같은 에러 발생RuntimeError: device >= 0 && device 환경- OS: Ubuntu 20.04.6 LTS- Python: v3.8.10- Torch: v2.0.1- CUDA: v11.7- GPU: A100 * 2 (MIG 적용) 해결- Single GPU 학습환경변수 CUDA_VISIBLE_DEVICES를 0으로 세팅해주니 해결됨export CUDA_VISIBLE_DEVICES=0 - Multi GPU 학습아직 CUDA 11과 12는 하나의 프로세스에 오직 하나의 MIG 인스턴스만 사용할 수 있으므로 불가능...참고로 CUDA 11부터 A100 MIG, CUDA 12부터 H100 MIG 사용이 가능함 참고 1: https://github.com/py..
kubeadm init 실행 시 container runtime is not running 에러 - containerd.io로 설치되는 config.toml 중 disabled_plugins = ["cri"]가 이슈를 발생시키는 것으로 추측됨 (참고) - 아래 명령어로 해결 sudo rm /etc/containerd/config.toml sudo systemctl restart containerd sudo kubeadm init kubectl get pod --all-namespaces를 확인 시 coredns가 ContainerCreating 상태에 갇힘 kubectl get node를 확인 시 master 혹은 control-plane 노드가 NotReady 상태 - CNI의 부재가 원인이므로 CNI..