카카오엔터테인먼트

카카오엔터테인먼트

개발팀 리뷰

위 내용은 카카오엔터테인먼트 전 • 현 재직자의 응답 결과입니다.

기술 스택

기술 스택 정보가 없어요.

재직자가 작성한 글

profile picture

박승규

카카오계열사에서 이것저것 만드는 개발자

Llama 3.3 70B를 파인튜닝하다 중단한 이야기

최근에 회사에서 특정 프롬프트의 성능을 올리기 위해서 프롬프트 엔지니어링과 파인튜닝을 진행해보았습니다. 프롬프트 엔지니어링을 사용해서 모든 케이스를 커버하고 있었습니다만, 조금 더 성능을 높이고 싶은 욕심이 있었기에, Llama 3.3이 새로나왔다고 하여 70B(700억파라메터)모델을 파인튜닝 해보기로 하였습니다. 7B의 경우는 로컬머신으로도 간단하게 파인튜닝이 가능했습니다만, 70B부터는 많은 문제들이 생겼습니다. 메모리가 부족하여 Cuda Out of Memory 를 수도없이 보았습니다. 70B를 파인튜닝 하기위해서는 최소 160GB의 메모리가 필요했기 때문입니다. 그리고 같은 텐서가 다른머신에 들어가서 데이터가 꼬이는 일도 발생하였습니다. 다양한 버그와 에러들을 뚫고 겨우겨우 학습을 시도하는 창이 떴습니다만.... 저는 여기서 포기할 수 밖에 없었습니다. 왜냐하면 학습하는데 332시간이 걸렸기 때문입니다. 클라우드에서 A100 16대를 사용하는 환경이었는데, 332시간이면 어림잡아 비용이 천만원이 나왔습니다. 그때 확실히 깨달았습니다. AI에는 돈이 많이 필요하구나... 심지어 가장 파라메터가 많은 405B모델도 아니었습니다. 405B모델은 4비트 양자화를 해서 파인튜닝 하는데에도 H100 8대가 필요했습니다. 서빙에는 H100 4대가 필했구요. Llama를 회사에서 서비스 하기위해 운영하는것은 참으로 가성비가 나오지 않는 일이었습니다. AI학습이 조금 더 저렴해지는 시기가 곧 오겠지만... 아직은 너무 비싸네요.

profile picture

박승규

카카오계열사에서 이것저것 만드는 개발자

[파이썬 팁] 두 개의 리스트의 원소가 같은지 확인하는 방법.

Counter를 사용하세요~ * 장점: 중복된 원소도 정확히 비교 가능 * 시간 복잡도 O(n) from collections import Counter list1 = ['apple', 'banana', 'cherry'] list2 = ['cherry', 'banana', 'apple'] print(Counter(list1) == Counter(list2)) # 중복 문자열 포함 예시 list3 = ['apple', 'apple', 'banana'] list4 = ['banana', 'apple', 'apple'] print(Counter(list3) == Counter(list4))

재직자가 좋아한 글

왜 제너럴리스트가 미래를 주도할까?  |  이것저것 얕은 지식 보다는 어느 분야에서 오래 가려면 전문화된 지식과 깊은 탐구가 중요하고 그만큼 스페셜리스트가 되는게 중요하다 라는 이야기 힌번 쯤 들어보셨을 것 같습니다. 하지만 우리가 살고 있는 AI 시대에서는 조금 다를 수 있을 것 같은데요 제너럴리스트가 가진 고유한 장점이 AI와 공존하는 세상에서 어떻게 더 중요한 역할을 할 수 있는지 다루고 있습니다. 과거의 전문화된 사고방식을 넘어, 변화하는 환경에서 제너럴리스트가 어떻게 적응하고 성공할 수 있는지 살펴볼 수 있습니다. 제너럴리스트란 무엇인가? * 다양한 분야를 탐구하며, 새로운 영역에 대한 호기심을 가진 사람. * 폭넓고 얕은 기술을 가지지만, 핵심은 적응력과 새로운 상황에서 문제를 해결하는 능력. * 서로 다른 분야의 지식을 결합해 창의적인 솔루션을 도출. 제너럴리스트가 활약하는 곳 * '악한 환경(Wicked Environments)': 규칙이 불확실하고 패턴이 명확하지 않은 상황에서 뛰어난 능력을 발휘. * 대조: 친절한 환경(Kind Environments): 반복적이고 명확한 패턴 속에서는 전문가가 우위. AI 시대의 제너럴리스트 * 대규모 언어 모델(LLM)은 친절한 환경에 적합하지만, 완전히 새로운 문제에서는 한계. * 제너럴리스트는 AI를 활용해 빠르게 새로운 영역에 적응하고 창의적으로 문제를 해결. * 과거의 "전문화" 중심 경제에서 "지능 배치" 경제로 전환하며, 적응력과 문제 해결력이 더 중요해짐. 역사 속 제너럴리스트의 사례 * 고대 아테네: 시민이 정치, 군사 등 다양한 역할을 수행하며, 삶의 통합성을 중시. * 점점 복잡한 사회로 전환하며 전문화가 필요했지만, AI의 도움으로 다시 다양한 역할 수행이 가능. 여러분은 자신이 개발자로서의 경력을 전문화와 다재다능 중 어느 쪽에 가깝다고 느끼시나요? https://every.to/chain-of-thought/why-generalists-own-the-future

좋아요 4 저장 13

thumbnail