백승윤

ML Engineer at Corca, Inc.

한국문화에 대한 QA 데이터셋인 CLIcK 등장

최근에 KorMedQA 본지 얼마나 되었다고 또 괜찮은 한국어 데이터셋을 발굴했습니다. KAIST의 Users & Information Lab 에서 만든 데이터셋인 CLIcK 인데요. ML 모델이 한국 문화를 잘 알고 있어야만 답할 수 있는 QA를 1,995개 만들었습니다. (예시는 사진을 참고하세용)

우리가 요즘에 애용하는 LLM 모델들은 외국 출신인 경우가 많은데요.. ㅎㅎ 그 친구들이 한국 문화에 얼마나 잘 적응할 수 있는지 테스트해보면 유용할 것 같네요. 특히 국내 스타트업에서 국내를 대상으로 LLM 활용하여 문제를 푼다면 더 도움이 될 것 같습니다.

다만 논문에서 아쉬운 것은 13개 모델에 대해 평가가 이뤄졌는데 그 모델들이 꽤나 구식이라고 생각합니다. 한국어 특화로는 HyperCLOVA, Global SOTA 모델로는 GPT-4-turbo, Gemini가 부재한 것이 아쉽습니다. 직접 해보는 수밖에 없겠네요.

논문 링크: https://arxiv.org/abs/2403.06412

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 3월 13일 오전 11:37

•

저장 11 • 조회 1,450

함께 읽은 게시물

데이터리안

Data Analyst

2일 전

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

데

- YouTube

www.youtube.com

저장 4 • 조회 962

골빈해커

Chief Maker

하루 전

그러고보니, 예전에는 입사 지원서에 희망연봉란이 있었는데 언젠가부터 사라졌네요. 왜 없어진걸까요? 제일 중요한건데…

채용과정은 지원자나 회사입장에서나 엄청난 시간과 노력이 드는거라, 합격했는데 연봉 수준이 안맞아서 취소되면 그 앞의 노력이 얼마나 허무한디…

댓글 1 • 조회 818

비슷한 게시물

골빈해커 Chief Maker

📝 MiniCPM, 2B로 70B를 뛰어넘은 LLM

골빈해커 Chief Maker

📝 LLM의 온도가 추론 정확도에 영향이 없다는 연구

이성규 스닙팟 CEO & Founder

앤트로픽에서 블랙박스와도 같았던 LLM 모델 내부에 대한 이해도를 높힐 수 있었던 최근 연구를 발표했어요.

골빈해커 Chief Maker

파플렉시티의 딥리서치는 ChatGPT의 딥리서치와 비교가 안되네요.

골빈해커 Chief Maker

ChatGPT Pro를 결제하고(💸) 쭈욱 좀 써봤는데요. 확실히 대단하긴 합니다.

최고은 프로덕트 디자이너

🤖생성형 AI 툴로 디자인해보자! (스터디 후기)

주간 인기 TOP 10

골빈해커 Chief Maker

오늘의 탐라는 “ChatGPT 쓰셨던데 그러고도 개발자입니까?”

김의중 프론트엔드 개발자

Claude Code 실전 가이드: AI 네이티브 개발자로 가는

Arawn Park Senior Engineer & Engineering Lead

넷플릭스는 왜 WebFlux를 사용하지 않을까?

psmon 블룸에이아이 서버 엔지니어

카프카를 우아하게 사용하기 -코틀린편

달레 Apollo GraphQL Software Engineer

알아 알아 알아! 🤣

장홍석 스페이스오디티 부대표/CPO

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

황경찬(Boaz) P.E.C CEO

"AI가 코드를 짜는 시대, 개발자의 가치는 무엇일까요?" 최근

정종윤 네이버 프론트엔드 개발자

👻 클라이언트에서 안전한 소셜 로그인 구현을 위한 OIDC와 PK

박승규 카카오계열사에서 이것저것 만드는 개발자

책이 출판되기 전 마지막 교정을 하고 있는데... GPT5가 출시

석민 커리어 코치

백엔드 개발자 이력서 고민

한국문화에 대한 QA 데이터셋인 CLIcK 등장

댓글 0

함께 읽은 게시물

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

비슷한 게시물

주간 인기 TOP 10

추천 프로필