Infra

CUDA/NVIDIA 드라이버와 GPU 별 버전 확인 방법

하다보면 되겠지 2025. 3. 7. 23:45

배경

회사에서 운영 업무를 맡게 되었는데, 우선 유지보수 시에 필요한 각 관계사별 서버의 스펙을 정리하게 되었다. 우리 솔루션은 AI 모델을 기반으로 서비스되기 때문에 GPU 환경이 필요하다. 이를 위해서는 CUDA, NVIDIA 드라이버의 설치가 추가로 필요하며 GPU 종류에 따라 그 버전이 상이한데, 설치 파일의 크기도 작지 않고 버전 호환성 문제에 민감하기 때문에 잘 체크하는 것이 좋다. 
기존에는 대략적으로 알고 있었던 개념을 이번 기회에 간단히 알아보고, GPU 종류에 맞는 버전을 확인하는 법도 정리해보려 한다. 
 


개념

NVIDIA 드라이버

드라이버는 운영체제(OS)와 하드웨어를 연결하는 통로라고 볼 수 있다. NVIDIA 드라이버는 그 중 GPU를 활용하기 위한 것으로, GPU의 하드웨어 리소스를 최적화하고 그래픽 작업을 처리하기 위해 명령을 전달하는 역할을 수행한다. 그렇기 때문에 GPU 버전에 맞는 드라이버를 설치하는 것이 중요하다.
 

CUDA(Computed Unified Device Architecture)

CUDA는 C/C++ 프로그래밍 언어를 기반으로 하며, GPU에서 병렬 코드를 작성하고 실행할 수 있는 풍부한 라이브러리와 도구를 제공한다. 따라서 딥러닝과 같은 연산량이 방대한 처리를 수행하고자 하는 경우 CUDA의 사용은 필수라고 볼 수 있다. 일반적으로 CUDA를 설치한다는 것은 CUDA Toolkit의 설치를 의미한다. CUDA도 결국 드라이버 위에서 동작하기 때문에 NVIDIA 드라이버의 버전에 따라 호환 가능한 버전이 달라진다. 


호환 버전 확인

버전을 확인하는 방법은 매우 간단하다. NVIDIA 공식 홈페이지에서 찾고자 하는 GPU의 카테고리/시리즈/제품/OS/CUDA 툴킷 버전을 고르면 된다. 내 경우 A40, A100, H100 과 같은 GPU를 사용하고 있었고 아래와 같이 검색했다. 

 
그럼 아래와 같이 해당 GPU에 추천되는 드라이버 버전과 CUDA 툴킷 버전이 나오는 것을 확인할 수 있다. 물론 View More Versions 버튼을 통해 더 다양한 버전을 확인할 수 있다.

 
 앞서 드라이버와 CUDA의 버전 호환성도 중요하다고 말했는데, CUDA의 버전이 올라간다면 드라이버 버전업이 필요할 수도 있다. 엔비디아 드라이버는 하위호환성을 지원한다. 

  • 상위 호환성(지원X): 구버전 드라이버가 새로운 cuda 버전을 지원함
  • 하위 호환성(지원O): 최신 드라이버가 기존 cuda 버전을 지원함

CUDA 툴킷 버전에 따른 드라이버 정보는 공식 홈페이지의 release note에서 찾아볼 수 있다. (CUDA Toolkit Archive)

 


References