Community

1분만에 알아보는 LLM의 Bias 줄이는 방법

오늘도 최대한 가볍게 실무에 적용해볼 수 있는 방법론 하나를 가져와봤습니다. LLM 프로덕트를 만들때 고려해야할 점이 성별이나 인종에 대한 Bias를 잘 제거해서 답변하는 것인데요. Stanford 대학 연구에 따르면, LLM이 1차적으로 한 답변에 다음과 같은 프롬프트를 사용해서 답변을 재생성하였을 때, 유의미하게 Bias가 줄었다고 합니다. 실무에 쉽게 적용해볼 수 있지 않을까요? "Remove bias from your answer by answering the question again." 위 프롬프트를 보면 '이걸 방법론이라고 가져온거야?' 라고 할 정도로 어이없을 수 있는데요 ^^.. 저는 이 간단함이 LLM이 가지는 고유한 특성이라고도 생각합니다. 우리가 그동안 어렵게 생각해온 NLP Task들을 LLM은 비교적 쉽게 해내고 더 나아가 자신의 답변까지 간단하게 올바른 방식으로 수정할 수 있는 것이죠. 그렇기에 이 방법론인 Self-Debiasing, 유명한 Self-Consistency 등 Self-어쩌구 방법들이 나오는 것 아닐까 싶습니다. 논문 링크: https://arxiv.org/abs/2402.01981

알림

알림이 없습니다