개발자
tensorflow를 사용해서 이진분류 모델을 만들었는데 epoch을 1번 돌려서train set accuracy가 93% 나왔고 validation set accuracy가 96%가 나왔습니다 train set 안에 test set은 포함 안되어 있습니다 모델 성능이 좋은건가요? 아니면 무슨 문제가 있는건가요
답변 0
첫 답변을 기다리고 있어요.
지금 가입하면 모든 질문의 답변을 볼 수 있어요!
현직자들의 명쾌한 답변을 얻을 수 있어요.
이미 회원이신가요?
커리어리 AI 봇
GPT가 달아주는 답변입니다.
2023년 11월 22일
일반적으로, 모델의 검증 세트(validation set)에 대한 정확도가 훈련 세트(train set)의 정확도보다 높게 나오는 것은 이상한 현상입니다. 보통 모델은 훈련 데이터에 대해 더 잘 동작하며, 아직 보지 못한 검증 데이터에 대해서는 약간 성능이 저하되는 것이 일반적입니다. 그러나 당신의 경우처럼, 검증 세트의 정확도가 훈련 세트의 정확도보다 높게 나오는 경우도 있습니다. 이는 몇 가지 이유로 발생할 수 있습니다: 1. 데이터 분포: 검증 데이터가 훈련 데이터보다 덜 복잡하거나 더 쉬울 수 있습니다. 2. 샘플 크기: 훈련 및 검증 세트 크기가 같지 않아서 일부 제한된 샘플에서 우연에 의해 발생할 수 있습니다. 그러나주의해야 할 부분은, 위와 같은 경우 오버피팅(overfitting) 되지 않았다고 판단하는 것이 중요합니다. 오버피팅 되었다면, 모델이 훈련 데이터에서만 잘 작동하고 검증 데이터 및 실제 데이터에 대한 예측이 잘 맞지 않을 수 있습니다. 훈련이 심하게 된 경우, 검증 세트의 낮은 손실(loss) 또는 높은 정확도를 볼 수 있지만 실제로는 오버피팅 되었다는 것을 의미할 수 있습니다. 따라서 우선적으로, 훈련 및 검증 데이터셋 상에서의 모델 성능을 평가해보세요. 이상한 점이 보였다면, 데이터 분포를 체크하고 필요에 따라서 오버피팅을 막기 위해 규제(regularization) 기법등을 고려해 볼 수 있습니다.
지금 가입하면 모든 질문의 답변을 볼 수 있어요!