LLM LoRA 학습 시켜보신 분 계신가요??

Question

안녕하세요 선배님들 저는 NLP에 관심이 많은 대학생입니다.

AI 법률 어드바이저 언어모델을 만들기위해 생활법령 100문 100답 데이터를 스크랩하여 LLM 학습에 맞는 데이터셋을 준비했습니다. 하지만 이유는 잘 모르겠는데 모델 학습이 수월하게 되지 않습니다... 학부생 수준에서 쉽지 않네요...

https://github.com/juicyjung/LAW-Alpaca

코드랑 세부사항은 여기 레포에서 보실 수 있고 Colab에서 작업했습니다.

현재 2가지 문제가 있습니다.

1. Training Loss가 어느순간부터 0으로만 나오는 현상 (LoraConfig의 r을 16 이상으로 올리거나 TrainingArguments epoch을 6 이상으로 늘릴 때 주로 발생)

2. 이상한 말을 막 내뱉는 현상 (학습이 된건지 안된건지 잘 모르겠습니다..)

훌륭한 선배님들 도움 주시면 감사하겠습니다..ㅠㅠ 열심히 해보려고 하는데 어려운게 많네요ㅠㅠ..

커리어리 AI 봇 · Answer

먼저 AI 법률 어드바이저 언어 모델을 만들기 위해 노력하시는 것을 보고 대단하다는 말씀을 드리고 싶습니다. 이런 과제는 쉽지 않지만, 과제를 완수하는 과정에서 많은 것을 배울 수 있습니다.

그러나 말씀하신 문제들을 정확하게 이해하기 어렵습니다. GitHub의 레포지토리에 있는 코드와 에러를 직접 보면 정확한 도움을 드릴 수 있을 것 같습니다.

그러나 일반적인 권장 사항을 제공할 수 있습니다:

1. raining Loss 0 현상: 일반적으로 Loss가 0이라는 것은 모델이 데이터를 완벽하게 학습했다는 의미입니다. 그러나 실제로 이런 현상은 거의 발생하지 않습니다. 일반적으로 이 현상은 코드에 오류가 있거나, 학습률(learning rate)이 너무 높아서 발생합니다. 학습률을 조정해보세요. 또한, 오버피팅(overfitting)이 발생했는지 확인해보세요. 오버피팅은 모델이 학습 데이터를 너무 정확하게 학습하여 새로운 데이터에 대한 예측 성능이 떨어지는 현상입니다.

2. 이상한 말을 내뱉는 현상: 이는 일반적으로 모델이 충분히 학습되지 않았을 때 발생합니다. 더 많은 에포크(epoch)로 학습하거나, 학습률을 조절해보세요. 또한, 데이터를 더 많이 모아서 학습해보는 것도 한 가지 방법입니다. 이 경우, 데이터를 더 많이 모으는 것이 어렵다면, 데이터 증강(data augmentation) 기법을 사용해보세요.

마지막으로, NLP 모델을 학습하는 것은 쉽지 않습니다. 언어는 복잡하며, 많은 예외 사항과 복잡한 패턴을 가지고 있습니다. 따라서, 문제를 해결하는 데 어려움을 겪는 것은 아주 자연스러운 일입니다. 계속해서 도전하시고, 여러 가지 방법을 시도해보세요. 그리고 커뮤니티에 도움을 청하면 많은 도움을 받을 수 있습니다.

이렇게 복잡한 과제에 도전하는 것에 대해 칭찬드리며, 좋은 결과를 얻기를 바랍니다. 행운을 빕니다!