Hi, there! 9월 24일 ~ 10월 1일 간 나온 AI 주요 포스트와 논문을 추려보았습니다. 저 Astro 비디오에 나오는, 파랗게 염색한 로봇 엔지니어의 모습 굉장히 섹시하네요. 🤩
• Amazon에서 가정용 로봇 Astro를 발표했습니다. 로봇 뒤에 숨겨진 과학(https://www.amazon.science/blog/a-more-useful-way-to-measure-robotic-localization-error)을 알아보세요. 과학자들은 SLAM 오차 문제의 해결을 위해 (국지적 일관성을 강화하는 궤적 계획을 위해) 새로운 메트릭을 제안했습니다. 멋진 비디오(https://youtu.be/YiHE5y1L2Bk) 또한 감상해보세요!
• DeepMind가 생성 모델을 통해 2시간 이내의 강수를 예측합니다. 의외로 2시간 미만의 단기 리드타임을 고해상도로 예측하는 건 기존 물리 방정식 해법으로 꽤 어려웠다고 하네요. 블로그(https://deepmind.com/blog/article/nowcasting)와 네이처에 실린 논문(https://www.nature.com/articles/s41586-021-03854-z)을 확인해보세요.
• Salesforce에서도 시계열 예측, 이상치 탐지 용도의 오픈소스 라이브러리 Merlion(https://github.com/salesforce/merlion)를 공개했습니다. 재밌게도 시계열 분석 영역이 AWS, Facebook, LinkedIn 등 테크 기업들의 각축장이 되어가네요. 실무에서 그만큼 많이 사용하고 있다는 방증이겠죠.
• 연산 시간과 메모리 공간을 줄이기 위해 트랜스포머를 양자화(https://arxiv.org/pdf/2109.12948v1.pdf)하는 새로운 접근 방식 3가지에 대해 알아보세요.
• BigSSL(https://arxiv.org/abs/2109.13226): Google이 대규모 자가 학습 모델을 사용하여 ASR(자동 음성 인식) 문제에 접근합니다.
• ML 안전성(https://arxiv.org/pdf/2109.13916v1.pdf)의 4가지 숙제, 즉 강건함, 모니터링, 얼라인먼트, 외부 접근으로부터의 안전함을 명확히 정의합니다.
• 우리가 애정 하는 멱 법칙(그러니까 파라미터 용적에 대한 규모의 법칙)을 저자가 깨 보려고 했지만 실패했습니다.(https://arxiv.org/pdf/2109.11928v1.pdf)
• 의미론적 유사성을 모델링할 때, 크라우드 소스 훈련 데이터를 선별하고 정제하면(https://arxiv.org/pdf/2109.11969.pdf) 모델 성능에 큰 영향을 줄 수 있습니다.
• 중간 미세 조정 작업(저는 사전 훈련으로 봅니다)은 언어 간 대화 상태 추적(https://arxiv.org/pdf/2109.13620v1.pdf)에 큰 도움이 됩니다.
• 합성 프롬프트와 대규모 언어 모델을 사용한 제로 레이블 학습(https://arxiv.org/pdf/2109.09193.pdf)입니다. 비지도 데이터 생성 작업이 매우 흥미로워 보입니다.
위 내용은 Alexa AI Deep Learning Blog에서 발행하는 AI 주간 뉴스에서 발췌, 번역하고 개인적으로 내용을 추가하여 만든 것입니다.