개발자
올해 컴공관련 전문대를 졸업한 상태입니다. 백앤드와 프론트중에 고민하다 백엔드 중 데이터사이언티스트,데이터분석 아니면 Ai관련 개발쪽으로 진로를 잡은 상태입니다. 진로의 관련된 경험중에 데이터 라벨링쪽에서 데이터 라벨링의 가이드라인을 작성하는 일을 한다면 경험적이나 실질적으로 도움이 될지 궁금합니다.
답변 3
안녕하세요. 현재 AI 스타트업에서 ML Engineer로 일하고 있는 백승윤이라고 합니다. 저는 도움이 될 것 같다고 생각합니다. 시간이 지날수록, AI 업계는 모델보다 좋은 퀄리티의 데이터가 더 중요해지고 있는데요. 지원자님께서 데이터 라벨링을 해보시며 퀄리티가 낮은 데이터들은 어떻게 처리를 할 것이며, 어떻게 효율적으로 라벨링을 할 것인지 고민하고 문제를 해결하신다면, 이후에 데이터 분석 업무에 있어서도 큰 도움이 될 거라 생각합니다. 다만, 우려되는 점은 하고자 하시는 데이터 라벨링 업무가 단순 반복 업무라면 추천하지 않습니다.
데이터 라벨링을 어떻게 하는지가 중요할 것 같은데요! 데이터 라벨링, 분류, 로그 정의 등은 데이터 분석을 위해서 중요한 부분을 차지하는 첫번째 업무라고 할 수 있습니다. 다만 이는 앞으로 대체될 수 있는 영역이며 진정한 데이터 분석이라고 하기는 어려울 것 같습니다. 따라서, 데이터 분야에 처음 발을 들이시면서 전반적인 데이터 업무를 이해하고 데이터 분석을 위한 큰 그림을 그릴 수 있는 라벨링 업무라면 괜찮다고 생각합니다! 다만 데이터 분석을 본격적으로 하고 싶으시다면 라벨링 업무만 오래 하는 것은 추천하지 않습니다!
삭제된 사용자
2024년 06월 22일
1. 이런 질문을 하는 경우는요. - 자신이 원하는 직무가 명확히 뭘 하는지 모르고 - 지금 잡을 수 있는 기회는 어차피 한정적인데 - 또 그 기회가 스스로도 그렇게 매력적이게 느껴지지는 않아서 - 자신의 명확치 않은 어떤 희망사항과 지금 당장의 기회가 부합한다는 '확신'이 필요하기 때문입니다. 만약 그렇다면, 그 말은 질문자님께서 확신이 없는 상태라는 이야기와 같고요. 2. 그래서! 대안과 함께 드리고 싶은 말은요.. 질문자님! 지금 당장은 다른 분들의 답변이 크게 와닿지 않을 수도 있고, 마음만 초조할 수 있어요. 그런데 거기에 다 해답이 있어요. 기회를 '어떻게 활용'할 것인가에 대한 고민이 지금 빠진 것 같습니다. 어차피 기회가 한정적이라면 그걸 최대한 잘 활용하는 능동성이 지금 가장 필요한 때 같아요. 그리고 당장 큰 기회가 오지 않는 일은 어쩌면 당연한 일임과 동시에, '당연히' 시간이 지니고 경력이 바뀌며 찾아올 것입니다. 당연한 말이죠? 가끔 그 당연함이 위로가 되기도 하더군요! 저도 잘 모르지만서요. 그래서 명쾌한 답은 어차피 존재할 수 없는 질문 같고요. 그냥 keep going 하시되 능동적으로 그 기회를 포트폴리오화 할 수 있도록 고민하고 잘 정리해보는 일을 권장드려요. '스스로'요. 그렇게 할 줄 아신다면 분야가 뭐든지 간에 탐나는 인재가 금방 되실 것 같네요 🙂
지금 가입하면 모든 질문의 답변을 볼 수 있어요!
현직자들의 명쾌한 답변을 얻을 수 있어요.
이미 회원이신가요?
커리어리 AI 봇
GPT가 달아주는 답변입니다.
2024년 06월 20일
데이터 라벨링과 가이드라인 작성은 분명히 데이터 관련 직무에서 중요한 역량입니다. 이는 AI 모델 학습에 사용되는 데이터를 미리 정의된 카테고리나 레이블로 분류하는 작업을 말하며, 모델의 성능에 결정적인 영향을 주기 때문입니다. 이러한 경험이 데이터 사이언티스트나 데이터 분석가로서 작업할 때 도움이 될 수 있는 몇 가지 이유는 다음과 같습니다: 1. **데이터 이해:** 데이터 라벨링을 통해 다양한 형태와 구조의 데이터를 이해하고, 어떤 정보가 중요하며 어떻게 처리될 수 있는지에 대한 감각을 키울 수 있습니다. 2. **질적 분석:** 데이터 라벨링은 종종 비정형 데이터(예: 텍스트, 이미지 등)에 적용되며, 이러한 비정형 데이터를 다루는 것은 많은 인사이트를 제공하고 복잡한 분석 기술을 필요로 합니다. 3. **모델 훈련 및 검증:** 그룹화, 분류 및 예측 같은 기계학습 모델을 훈련하려면 라벨링된 데이터가 필요합니다. 따라서, 데이터를 정확하게 라벨링하는 것은 모델의 성능을 직접적으로 영향을 줍니다. 가이드라인 작성 역량도 중요합니다. 가이드라인은 데이터 라벨링의 품질과 일관성을 보장하는 데 도움이 되며, 이는 결국 모델이 실제 세계를 얼마나 잘 이해하고 예측할 수 있는지에 대한 기준을 설정하는 것입니다. 결과적으로, 데이터 라벨링 및 관련 가이드라인 작성 경험은 데이터 직무를 수행하는데 많은 도움이 될 것입니다.
지금 가입하면 모든 질문의 답변을 볼 수 있어요!