Hi, there! 9월 10일 ~ 9월 17일 간 나온 AI 주요 포스트와 논문을 추려보았습니다. 제가 MLOps 주제를 꽤 좋아하기 때문에 Chip Huyen의 포스팅을 따로 넣어봤습니다. 즐거
Hi, there! 9월 10일 ~ 9월 17일 간 나온 AI 주요 포스트와 논문을 추려보았습니다. 제가 MLOps 주제를 꽤 좋아하기 때문에 Chip Huyen의 포스팅을 따로 넣어봤습니다. 즐거운 한가위 보내세요! 🌕 • 데이터 과학자가 Kubernetes를 알 필요 없는 이유(https://huyenchip.com/2021/09/13/data-science-infrastructure.html) – 요약: (1) 회사는 데이터 과학자가 개발과 운영 도구 양쪽을 풀 스택으로 알고 있길 바란다. (2) 물론 데이터 과학자가 프로젝트에 엔드 투 엔드로 관여한다면 작업 속도가 향상되고 커뮤니케이션 비용이 크게 감소한다. 다만, 그들이 데이터 과학에 집중할 수 있도록 저수준 인프라를 추상화하는 도구를 도입해야 한다. (3) 인프라 추상화 도구(Kuberflow, Metaflow)는 워크플로 오케스트레이터(Airflow, Argo, Prefect)와는 다르며 데이터 과학자들이 개발과 운영 양쪽에서 코드로 작업 가능하게 만드는 것이 그것의 핵심이다. (그러니까, Kubernetes는 알 필요 없지만 Kuberflow는 알면 좋다? 😔) • 텍스트 없는 NLP: 원천 오디오로부터 표현력이 뛰어난 음성 생성하기(https://ai.facebook.com/blog/textless-nlp-generating-expressive-speech-from-raw-audio/) – AI 커뮤니티를 뜨겁게 달구었던 논문이네요! Facebook이 오디오 전용의 언어 모델을 만들어 멋진 작업을 해냈습니다. 논문(https://arxiv.org/abs/2109.03264)과 코드(https://github.com/pytorch/fairseq/tree/master/examples/textless_nlp)도 참조하세요. • STraTA: 더 나은 퓨 샷 학습을 위해 작업 증강을 통한 자가 학습(https://arxiv.org/abs/2109.06270) – 관련 없는 데이터로 부수적인 작업을 미세 조정하는 대신에 의사 레이블(pseudo-label)이 달린, 해당 도메인의 데이터를 학생을 위한 교사 모델로부터 생성합니다. • LM-Critic: 문법적 오류 수정을 위한 비지도 언어 모델(https://arxiv.org/abs/2109.06822) – 사람들이 매번 이런 모델이 있냐고 묻는데, 자 여기 있습니다! 😊 • 명확한 질문이 포함된 오픈 도메인 대화 말뭉치 구성과 평가(https://arxiv.org/abs/2109.05794) – 오픈 도메인 대화와 신규 데이터 셋(https://github.com/aliannejadi/ClariQ)을 보다 잘 처리하기 위해 노력한 작업물입니다. 위 내용은 Alexa AI Deep Learning Blog에서 발행하는 AI 주간 뉴스에서 발췌, 번역하고 개인적으로 내용을 추가하여 만든 것입니다.