김문수

토스 데이터 엔지니어 | ex-뱅크샐러드

네이버에서 모델 성능 유지하며 귀한 GPU를 CPU로 대체한 방법

요즘 비용 절감이 큰 화두죠. gpu 자원은 예나 지금이나 귀하고 비싼데요. 학습할 때야 gpu를 쓰지만, 서빙할 때는 이제 고민을 합니다. gpu는 한정적이니까요.

그래서 느린 성능을 감안하고 cpu로 서빙하거나, 비용에도 불구하고 gpu를 쓰거나, 어떻게든 튜닝하거나 하는데, 어떻게든 튜닝한 사례를 소개합니다.

네이버 글로벌 플레이스팀에서 동일한 성능을 유지하면서 model server를 gpu에서 cpu로 전환하여 연간 약 4억원의 비용절감을 했다고 합니다.

글은 cpu로 바꾸고 나서의 성능 진단(rps와 response가 10배~20배 정도 느렸다고 합니다.), 많은 수의 cpu 를 사용했을 때 병렬도가 떨어지는 pytorch 내의 원인 파악, 모델 경량화, 검증까지 이어지는데요. ml 모델 서빙에 관심이 있으면 읽어보면 좋겠습니다.

https://medium.com/naver-place-dev/ml-model-server-gpu-cpu-전환-경험-공유-251e024acb35

ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유

Medium

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 10월 16일 오전 12:35

•

저장 42 • 조회 2,800

함께 읽은 게시물

K리그 프로그래머

커피한잔 개발자

4일 전

앱 개발 개척시대

앱 개발 개척시대

K리그 프로그래머

•

저장 6 • 조회 1,699

골빈해커

Chief Maker

4일 전

📰 OpenAI가 ChatGPT의 커넥터 기능을 업데이트하면서 MCP 지원을 추가했네요.

저장 6 • 조회 1,420

이상우

Staff Back-end Engineer

5일 전

용인시 도서관 휴먼북 인터뷰

용

용인시 도서관 휴먼북 인터뷰

I'm Prostars

저장 1 • 조회 1,335

하조은

당근 Product Engineer

2일 전

발이 닿지 않는 바다에서

우

발이 닿지 않는 바다에서

hajoeun.com

•

저장 2 • 조회 1,590

석민

커리어 코치

하루 전

전략적 입사 지원

전

저장 11 • 조회 542

석민

커리어 코치

3일 전

ATM이 삼킨 카드

저장 1 • 조회 450

비슷한 게시물

몽상가 프로그래머 Lead engineer of machine learning

GPU CPU

소성은 Gen AI Field Solution Architect @ Google

Google에서 Gemma라는 LLM을 공개했습니다.

서진호 sr. Presales Solution Architect, HPC&AI

골빈해커 Chief Maker

GPU가 범용 프로세서라고 불리게 되다니. 오래 살고 볼 일이다.

이명진 한국레드햇 솔루션 아키텍트

딥러닝용 멀티 GPU 리눅스 머신 설정하기

강병진 GS 52g Studio 개발자

스트림릿 코드 작성을 도와주는 SnowFlake 모델

주간 인기 TOP 10

골빈해커 Chief Maker

[광고] 다음 직무 채용 예정입니다. - 프러덕트/사업 기획 1

김의중 프론트엔드 개발자

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

달레 Apollo GraphQL Software Engineer

🌎 해외에서 일하면 뭐가 좋을까요❓

K리그 프로그래머 커피한잔 개발자

앱 개발 개척시대

psmon 웹노리라이터

서버엔지니어의 시대적 고민

장홍석 스페이스오디티 부대표/CPO

< 서비스를 중독성 있게 만드는 결정적 원리 >

레드버스백맨 리서처 앤 라이터

⟪UX 디자이너가 사라지고 있다⟫

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

하나부터 열까지 리더가 상세히 설명해 주기를 바라는 구성원이 있습

평비 LGCNS 백엔드 개발자

개발자 교양 팟캐스트

조찬우 Coupang Sr. iOS Engineer

iOS 19가 아니라 이제 iOS 26?

네이버에서 모델 성능 유지하며 귀한 GPU를 CPU로 대체한 방법

댓글 0

함께 읽은 게시물

앱 개발 개척시대

용인시 도서관 휴먼북 인터뷰

발이 닿지 않는 바다에서

전략적 입사 지원

ATM이 삼킨 카드

비슷한 게시물

주간 인기 TOP 10

추천 프로필