이명진

한국레드햇 솔루션 아키텍트

딥러닝용 멀티 GPU 리눅스 머신 설정하기

딥러닝을 위해서 싱글 GPU 머신 대신 멀티 GPU 머신을 설정하면 보다 효율적인 데이터 사이언스 업무가 가능한데요, 관련해서 좋은 기사 공유합니다.😃 (출처: TDS)

<2024년 딥러닝을 위한 멀티 GPU 리눅스 머신을 설정하는 방법>

딥러닝을 시작하려면 CUDA 툴킷 및 파이토치(PyTorch)와 같은 필수 라이브러리를 사용하여 다중 GPU Linux 시스템을 설정해야 합니다.

exllamaV2, torchtune 등의 오픈소스 프레임워크를 사용하여 딥러닝을 위한 CUDA 툴킷, PyTorch, 미니콘다(Miniconda)를 설치합니다.

터미널에서 nvidia-smi 명령을 사용하여 머신에 설치된 GPU 수를 확인합니다. 설치된 모든 GPU 목록이 인쇄되어야 합니다. 불일치가 있거나 명령이 작동하지 않으면 먼저 Linux 버전에 맞는 Nvidia 드라이버를 설치해야 합니다.

CUDA 툴킷 설치

usr/local/cuda-xx에서 기존 CUDA 폴더를 확인합니다. 이는 CUDA 버전이 이미 설치되어 있음을 의미합니다.
원하는 PyTorch 라이브러리에 필요한 CUDA 버전을 확인합니다.
CUDA 툴킷 12.1 다운로드로 이동하여 설치합니다.
UDA 툴킷을 설치하는 동안 설치 프로그램에서 커널 업데이트 메시지를 표시할 수 있는데, 커널 업데이트를 위한 팝업이 터미널에 나타나면 esc 버튼을 눌러 취소하세요.
설치 후 Linux 시스템을 다시 시작합니다. PATH에 CUDA 설치를 추가하기 위해 nano 편집기를 사용하여 .bashrc 파일을 엽니다.
터미널을 닫았다가 다시 엽니다.

Miniconda 설치

PyTorch를 설치하기 전에 Miniconda를 설치한 다음 Conda 환경 내에 PyTorch를 설치하는 것이 좋습니다. 각 프로젝트마다 새로운 Conda 환경을 만드는 것도 편리합니다.
터미널을 닫았다가 다시 엽니다.

PyTorch 설치

CUDA 버전에 맞는 PyTorch 라이브러리를 설치합니다.
PyTorch 설치 후 터미널에서 PyTorch에 표시되는 GPU 수를 확인합니다. 그러면 시스템에 설치된 GPU 수가 print되어야 하며 nvidia-smi 명령에 나열된 GPU 수와도 일치해야 합니다.

다중 GPU 설정(LLM)을 활용하는 딥러닝 프로젝트 시작하기

추론(Inferencing, LLM 모델 사용)을 위해 exllamav2를 별도의 환경에 복제하고 설치합니다. 이는 더 빠른 추론을 위해 모든 GPU를 사용합니다.
미세 조정(fine-tuning)이나 학습을 위해 torchtune을 복제하고 설치할 수 있습니다.

원본 기사 링크는 아래와 같습니다. 감사합니다🙏

[Source Link] https://towardsdatascience.com/how-to-setup-a-multi-gpu-linux-machine-for-deep-learning-in-2024-df561a2d3328

How to Set Up a Multi-GPU Linux Machine for Deep Learning in 2024

Medium

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 5월 30일 오전 7:55

저장 4 • 조회 1,121

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

하루 전

< 케이팝이 진짜 필요한 건 ‘숫자’가 아니다 >

1. 저는 플랫폼/유통업계에서 엔터로 넘어왔어요. 엔터 시장에서 일하며 놀랐어요. 온라인 플랫폼과 커머스에서 CRM은 상식인데, 케이팝 업계에 CRM 개념이 없다는 사실에 큰 충격을 받았어요.

댓글 1 • 저장 1 • 조회 257

장홍석

스페이스오디티 부대표/CPO

3일 전

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

•

댓글 1 • 저장 5 • 조회 718

장홍석

스페이스오디티 부대표/CPO

2일 전

< 혁신의 첫 반응은 '박수'가 아니라 '야유'다 >

댓글 1 • 저장 1 • 조회 418

비슷한 게시물

달레 Apollo GraphQL Software Engineer

ps 쉘 커맨드 사용법

HoJoong Kim Senior IT guy

[Dev]모든 개발자가 마스터해야 할 7가지 AI 프레임워크!

Jonas Kim 데이터 과학자, ML 엔지니어

Paper Review 1 - FlashAttention

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

보통 기업의 AI 전략 - 데이터, 데이터, 데이터

변성윤 머신러닝 엔지니어, Engineering Manager

아자르에서 AI 추천 모델의 타겟 지표를 설정하는 방법 (아하모먼트)

백선환 AWS/ AIML Specialist

AI 비용을 90% 지연 시간을 85% 단축하는 프롬프트 캐싱

주간 인기 TOP 10

골빈해커 Chief Maker

오늘의 탐라는 “ChatGPT 쓰셨던데 그러고도 개발자입니까?”

김의중 프론트엔드 개발자

Claude Code 실전 가이드: AI 네이티브 개발자로 가는

Arawn Park Senior Engineer & Engineering Lead

넷플릭스는 왜 WebFlux를 사용하지 않을까?

psmon 블룸에이아이 서버 엔지니어

카프카를 우아하게 사용하기 -코틀린편

달레 Apollo GraphQL Software Engineer

알아 알아 알아! 🤣

장홍석 스페이스오디티 부대표/CPO

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

황경찬(Boaz) P.E.C CEO

"AI가 코드를 짜는 시대, 개발자의 가치는 무엇일까요?" 최근

정종윤 네이버 프론트엔드 개발자

👻 클라이언트에서 안전한 소셜 로그인 구현을 위한 OIDC와 PK

박승규 카카오계열사에서 이것저것 만드는 개발자

책이 출판되기 전 마지막 교정을 하고 있는데... GPT5가 출시

석민 커리어 코치

백엔드 개발자 이력서 고민

딥러닝용 멀티 GPU 리눅스 머신 설정하기

댓글 0

함께 읽은 게시물

< 케이팝이 진짜 필요한 건 ‘숫자’가 아니다 >

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

< 혁신의 첫 반응은 '박수'가 아니라 '야유'다 >

비슷한 게시물

주간 인기 TOP 10

추천 프로필