[240108] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

모두의연구소는 지식을 나누며 함께 성장하는 국내 최대 AI 커뮤니티입니다. 1. 대규모 언어 모델의 창발적 능력에 대한 새로운 분석: 규모 이상의 요인 탐구 최근 연구는 대규모 언어 모델에 나타나는 창의적 능력에 초점을 맞춥니다. 이 능력은 소규모 모델에서는 보이지 않지만 대규모 모델에서 나타나는 급작스러운 변화로, 예측하기 어려운 특성을 가집니다. 그러나 이 연구는 모델 규모가 아닌 측정 기준의 선택에 따라 신흥 능력이 나타날 수 있다는 대안적 설명을 제시합니다. InstructGPT/GPT-3 제품군과 BIG-Bench를 사용한 분석과 다양한 심층 네트워크에서의 새로운 메트릭 테스트를 통해 이 연구는 창의적 능력이 AI 모델 확장의 본질적 속성이 아니라는 증거를 제공합니다. https://arxiv.org/abs/2304.15004 2. LLM은 LongLM일지 모른다 : Self-Extend으로 대규모 언어 모델의 내재된 장문 처리 능력 활용하기 최근 연구는 대규모 언어 모델(LLM)이 별도의 미세 조정 없이도 긴 문맥을 처리할 수 있는 내재된 능력을 발견하고, 이를 활용하기 위해 Self-Extend라는 새로운 방법을 제안합니다. 이 방법은 LLM의 컨텍스트 윈도우를 자체적으로 확장하며, 그룹 수준과 이웃 수준의 주의 정보를 통합하여 추가 학습 없이 구현됩니다. 실험 결과는 Self-Extend가 기존 LLM의 컨텍스트 윈도우 길이를 효과적으로 확장하는 것을 입증하며 이는 LLM의 활용 가능성을 크게 확장합니다. https://huggingface.co/papers/2401.01325 3. 자바스크립트로 iCloud 정리하기 블로그 작성자는 200GB와 1TB 저장 공간의 비용 차이가 많이 나서 대안을 찾기 시작했습니다. 사진이 대부분의 저장 공간(약 127GB)을 차지하고 있었기 때문에 파일 크기별로 정렬하는 기능을 찾았지만 애플 사진이나 iCloud 브라우저에서 이 기능을 제공하지 않았습니다. 다른 앱들을 통해 중복 사진을 찾거나 파일 크기를 확인할 수 있지만 iCloud에 오프로드된 사진은 이러한 앱에서 나타나지 않아 완전히 유용하지는 않았습니다. 또한, 모든 사진을 앱이 스캔하는 것에 대해 우려도 있었습니다. JavaScript를 이용하여 사진을 정리해봤습니다. https://andykong.org/blog/icloudconfusion 4. CertInfo: 어떤 루트 인증서를 신뢰해야 할까요? 방문한 웹사이트들의 인증서를 분석하는 오픈소스 프로그램 'CertInfo'를 만들었습니다. 이 프로그램은 사용자의 브라우저 기록을 분석하여 방문한 도메인들의 인증서를 조회합니다. 그 결과로 사용된 루트 인증서 목록과 사용되지 않은 루트 인증서 목록을 제공합니다. https://raymii.org/s/software/Which_Root_Certificates_Should_You_Trust_CertInfo.html ---------------------------------------------------------------------------------- 📍 Share Value, Grow Together 지식을 공유하며 함께 성장하는 모두에게 열린 연구소 모두의연구소 바로 살펴보기 : https://bit.ly/3TAJvgp

[240108] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

알림