아마존웹서비시즈

아마존웹서비시즈

개발팀 리뷰

위 내용은 아마존웹서비시즈 전 • 현 재직자의 응답 결과입니다.

기술 스택

기술 스택 정보가 없어요.

재직자가 작성한 글

profile picture

소성은

Solutions Architect @ AWS

DeepMind의 AlphaProof와 AlphaGeometry2

DeepMind에서 예전에 AlphaTensor로 발견되지 않았던 더 효율적인 matrix multiplication 방법을 찾아냈었는데요, 이번에는 국제수학올림피아드 문제를 풀었을 때 은메달 수준을 달성했다고 합니다. 현재의 LLM은 매우 뛰어나지만, 아직까지 reasoning (특히 수학과 같은 분야) 능력이 많이 부족한데요, 이번 결과는 일반인 보다 훨씬 뛰어난 reasoning을 달성했다는 점에서 정말 대단하다고 보여집니다. Gemini를 AlphaZero에 사용했던 것과 유사한 강화학습 방법으로 fine-tuning을 했다고 합니다만, 자세한 내용이 공개되어 있지는 않습니다. 아마 천천히 research paper나 관련 코드들을 조금씩 공개하지 않을까 싶습니다. 개인적으로 아직은 AGI는 한참 멀었다고 생각하지만, 다양한 기술들이 합쳐지고 빠르게 발전하면서 여러 분야에서 사람을 뛰어넘는 경우가 많이 생길 것 같습니다. https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

profile picture

소성은

Solutions Architect @ AWS

Mistral Large 2 공개

Llama 3.1 이 공개된지 얼마나 되었다고 하루이틀 만에 Mistral Large 2가 공개되었습니다. 흥미롭게도 벤치마크 비교에 Llama 3.1 관련 내용을 다 넣어놓았습니다. 미리 모델을 받아서 테스트해봤거나 공개되자마자 테스트해 본 걸까요? 정말 매우 빠르게 테스트를 했네요..ㄷㄷ 아무튼 벤치마크 성능을 보면 SOTA 모델들과 비슷하거나 조금 낮은 수준이지만, 크기가 123B 정도라서 Llama 3.1 405B에 비하면 훨씬 production 적용이 용이해 보인다는 점이나 llama가 multilingual을 지원한다고는 하지만 한국어가 공식적으로 지원되지는 않는데 여기서는 지원된다는 점이 특징일 것 같습니다. 공개된 모델 자체는 research only 라이센스입니다만, 많은 회사들이 계약을 맺고 API 형태로 제공해줄 것 같습니다. 여러모로 경쟁이 심한만큼 좋은 모델들이 계속 쏟아져 나오는군요..ㅎㅎ https://mistral.ai/news/mistral-large-2407/

재직자가 좋아한 글

ML/AI 엔지니어를 인터뷰하고 고용하는 방법  |  ML/AI엔지니어를 채용하고자 하시는 분들 뿐만 아니라 이 분야로 진출하고자 하는 분들이 참고하시면 좋을거 같습니다. 다만, 지극히 저자의 주관적인 견해임을 미리 밝힙니다. 좋은 인재를 채용하는 것은 미션과 조직을 위해 할 수 있는 가장 영향력 있는 활동입니다. 그리고 효과적인 면접을 진행하는 것이 좋은 채용의 핵심입니다. 면접 프로세스는 하나의 시스템으로 생각할 수 있습니다: 지원자가 주어지면 그 지원자가 해당 직무와 팀에 적합한지 평가합니다. 따라서 성공적인 채용을 위해서는 면접 시스템이 잡음을 최소화하면서 신뢰할 수 있고 타당해야 합니다. < 고려해야 할 기술적 역량 > 1) 소프트웨어 엔지니어링에 대한 기본 소양: 코딩 스킬, 코드 작성 기술과 경험, 논리적 문제 분석, 읽기 쉽고 유지 관리 가능한 코드 작성 여부, 에지 케이스 고려 여부 등 * 문제를 논리적으로 분석하고, 깔끔하고 읽기 쉽고 유지 관리가 가능한 코드를 작성했는가 * 엣지 케이스를 고려하고,코드를 작성하는가? * 피드백에 잘 대응하는가? 2) 데이터 해독 능력: 데이터 리터러시 이해, 통계나 테이블 조인, 데이터 불일치, 시각화 측면등의 데이터 분석 역량, 도메인 기반 지식 * 데이터를 어떻게 정리했나요? 어떤 문제에 직면했으며 어떻게 해결했나요? * 오해의 소지가 있는 요약 통계는 무엇인가요? 어떤 통계가 다른 통계보다 더 유용했나요? * 만든 데이터 시각화 중 인사이트가 있었던 데이터 시각화는 무엇이며 그 이유는 무엇인가요? * 가장 도움이 되지 않았던 것은 무엇인가요? 3) ML에 내재된 불확실성과 불투명성에 대한 이해도 * 어떤 예상치 못한/편향된 결과를 본 적이 있나요? 필요한 경우 어떻게 해결했나요? * 모델을 사용자와 일치시키기 위해 모델에 어떤 가드레일/정책을 적용하고 있나요? * 모델에서 편향성을 발견했다면 어떻게 완화할 수 있을까요? 4) ML 제품 구축 기반 경험 * 재학습 또는 업데이트 시 시간이 지남에 따라 모델 성능을 어떻게 측정했나요? * 모델 성능이 사전 정의된 임계값을 위반했을 때 어떻게 대응했나요? * 초기 평가 데이터를 어떻게 수집하고 평가 하네스를 구축했나요? * 모델이나 시스템에 대한 오류 분석을 어떻게 평가하고 수행했나요? * 직면한 제약 조건은 무엇이었으며, 어떤 어려운 타협을 해야 했나요? * 모델 또는 시스템에 대한 안전장치와 정책을 어떻게 구현했나요? * 결과는 어땠으며, 돌이켜보면 무엇을 다르게 했으면 좋았을까요? < 고려해야 할 비기술적 역량 > 1) 모호성(A): 후보자가 문제를 해결하기 시작했을 때 문제가 얼마나 모호했는지 확인 필요 * 해당 문제에 업계에서 알려진 해결책과 모범 사례가 있나요? 아니면 선행 기술 없이 이전에 해결되지 않은 문제인가요? * 지원자가 면밀한 감독을 받았나요? 아니면 대부분 혼자서 해결했나요? 2) 영향력(I) * 지원자가 다른 사람들과 협업하고 영향력을 발휘하는 방식 파악 * 로드맵/디자인 검토, 업무 시간, 프로젝트에 대한 조언, 멘토 역할 등 * 자신의 직접적인 기여뿐만 아니라 주변 사람들의 성과를 높이는 역할/경험 여부 3) 복잡성(C) * 문제 공간의 복잡성을 의미 * 지원자가 작업한 복잡성의 수준을 이해하고 이에 익숙해져 있는 동시에 솔루션의 효과성을 파악 4) 실행력(E) * 제한된 자원과 일정 내에서 후보자가 제공할 수 있는 능력 * 후보자가 얼마나 빨리 실패하고, 배우고, 반복할 수 있는지 * 팀이나 업계 전반에 걸쳐 채택되는 새로운 접근 방식을 개척하거나 필요한 노력의 범위와 규모(예: 팀 수)등에 대한 견해 => 회사의 역할과 단계에 따라 AICE 특성의 우선순위가 달라질 수 있습니다. 초기 단계의 스타트업은 모호성과 실행을 우선시하는 반면, 성숙한 기술 기업은 더 많은 영향력과 복잡성 관리가 필요할 수 있습니다. 다음의 전화화면 보정하거나 면접 루프, 디브리핑을 실시하는 방법은 원문을 참고해주시기 바랍니다. * 전화 화면 * 면접 루프 * 디브리핑 * 면접관과 채용 관리자를 위한 몇 가지 팁과 좋은 인재의 몇 가지 특징에 대한 의견 * source: https://eugeneyan.com/writing/how-to-interview/

좋아요 17 저장 25

thumbnail