12/25 AI & ML Blog Posts Weekly Summary
๐ MS ๋ฆฌ์์น 2022๋ ์ฑ๊ณผ ์ ๋ฆฌ(https://www.microsoft.com/en-us/research/blog/2022-a-look-back-at-a-year-of-accelerating-progress-in-ai/): ์ฐ๊ตฌ์๊ฐ ์๋ ์ฌ์ฉ์ ์ ์ฅ์์ ๊ด์ฌ ๊ฐ๋ ๊ฒ๋ค์ ์ด๊ฑฐํด๋ณด์๋ฉด, CV (Swin Transformer v2), NLP (์ฑ๋ด์ ์ํ ์ธ์ด ๋ชจ๋ธ GODEL, ๋ฉํฐ๋ชจ๋ฌ BEiT, ์ธ์ด ๋ชจ๋ธ ๋๋ฒ๊น ๋๊ตฌ AdaTest, ์ ํด ์ฝํ ์ธ ๋ฐ์ดํฐ ์์ฑ ๋๊ตฌ ToxiGen) ๋ชจ๋ธ ํ๋ จ๊ณผ ์ถ๋ก (NN HPO๊ธฐ๋ฒ ยตTransfer, ๋ชจ๋ธ ์์ถ๊ณผ ์์ํ๋ฅผ ์ํ DeepSpeed Compression) ์ ๋? ๐ Fortuna ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ณต๊ฐ(https://aws.amazon.com/blogs/machine-learning/introducing-fortuna-a-library-for-uncertainty-quantification/): AWS Labs์์ 12์ ์ฌ๋ฐ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๋ ๊ฐ๋ฅผ ๊ณต๊ฐํ๋๋ฐ ์ด๊ฑด ๋ฅ๋ฌ๋์ '๊ณผ์ ' ๋ฌธ์ ํด๊ฒฐ์ ์ํด ํ์ค์ ๋ง๊ฒ ํ๋ฅ ๊ฐ์ ๋ณด์ ํด์ฃผ๋ ๋๊ตฌ์ ๋๋ค. Flax ๋ชจ๋ธ ๊ฐ์ฒด ์๋๋ฉด ํ๋ ์์ํฌ์ ๋ฌด๊ดํ ์ถ๋ ฅ ๊ฒฐ๊ณผ ํ์ผ์ด๋ ํ๋ฅ ๊ฐ์ ์ ๋ ฅ์ผ๋ก ์ค ์ ์์ต๋๋ค. ๐ Renate ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ณต๊ฐ(https://aws.amazon.com/blogs/machine-learning/automatically-retrain-neural-networks-with-renate/): ์ด๊ฑด ์ ๊ฒฝ๋ง ์๋ ์ฌํ์ต์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ์ฌํ์ตํ ๋ ๊ณผ๊ฑฐ ๋ฐ์ดํฐ์ ๋ํ ์ฑ๋ฅ์ ํ๋ฝํ๋ ์ด๋ฅธ๋ฐ 'ํ๊ตญ์ ๋ง๊ฐ' ํ์์ ์๋นํ ๋ฐฉ์งํด ์ค๋๋ค. ๋ํ ์ง์์ ํ์ต์ ๋ํ HPO์ ํด๋ผ์ฐ๋ ๋ฒก์๋ ํ์ต์ ์ง์ํฉ๋๋ค. ๐ SageMaker Feature Store์ Apache Iceberg ํฌ๋งท ์ง์(https://aws.amazon.com/blogs/machine-learning/speed-ml-development-using-sagemaker-feature-store-and-apache-iceberg-offline-store-compaction/): ํ์ค Glue ๋์ Iceberg ํ ์ด๋ธ ํฌ๋งท์ผ๋ก ํผ์ณ ๊ทธ๋ฃน ์์ฑ์ด ๊ฐ๋ฅํด์ก์ต๋๋ค. ๊ทธ ๊ฒฐ๊ณผ Glue Job ์ค์ผ์ค๋ง์ผ๋ก ํ ์ด๋ธ ์์ถ๊ณผ ์ค๋๋ ์ค๋ ์, ๊ณ ์ ํ์ผ ์ ๊ฑฐ๋ฅผ ์ ๊ธฐ์ ์ผ๋ก ํด์ค ์ ์์ต๋๋ค. ์คํ๋ผ์ธ ์คํ ์ด์ ๋ํ Athena ์ฟผ๋ฆฌ ์๋๊ฐ 10~100๋ฐฐ ํฅ์! ํด๋น ๋ด์ฉ๋ค์ ์ Github(https://github.com/youngmki/awesome-aiml-blog)์์ ๊ณ์ ์์นด์ด๋น ์ค์ ๋๋ค.