두 개의 텍스트 파일을 합쳐서 gzip으로 압축하고, 파일 사이즈로 거리를 삼아 문서간 유사도를 측정했더니, BERT 등을 이용한 kNN보다 성능이 좋았다고. 😳 DNN은 최고의 압축 알고리즘이
두 개의 텍스트 파일을 합쳐서 gzip으로 압축하고, 파일 사이즈로 거리를 삼아 문서간 유사도를 측정했더니, BERT 등을 이용한 kNN보다 성능이 좋았다고. 😳 DNN은 최고의 압축 알고리즘이라는 말이 생각나는군요. 😲 https://aclanthology.org/2023.findings-acl.426