Top 5 ways to implement MLOps successfully in your organization
www.redhat.com
AI/ML 도입 및 채택이 기업의 핵심 역량이자 가치로 떠오르면서 ML옵스(MLOps)가 각광받고 있는데요. ML옵스 플랫폼을 성공적으로 구현할 수 있는 방법들을 소개합니다.
<조직에서 ML옵스를 성공적으로 구현하는 5가지 방법>
❗️기업에서 MLOps를 성공적으로 구축하려면 보안, 워크플로우, 유연성 및 개발자, 운영 관리자 및 데이터 과학자가 협력하는 방식을 고려하는 구체적인 방안이 필요합니다.
1️⃣ 유연한 기반으로 시작: 하이브리드 클라우드(온프레미스+퍼블릭 클라우드)
🌈인공 지능(AI) 모델을 학습하고 처리하기 위해 여러 환경을 사용한다고 가정 시 온프레미스, 클라우드, 하이브리드 클라우드 환경을 지원하고 서비스 간 마이그레이션을 보다 효율적으로 수행할 수 있는 유연한 기반을 적용하는 것이 가장 좋습니다.🙏
🌈오픈 소스는 선택의 자유와 혁신적인 솔루션을 활용할 수 있는 옵션을 제공하므로 필요한 유연성을 제공합니다. 글로벌 오픈소스 커뮤니티에서 AI와 ML 분야의 혁신이 일어나고 있습니다.해당 커뮤니티에서 개발된 소프트웨어를 선택하면 여러분이 속한 기업의 고유한 요구 사항에 맞는 고급 기술이나 애플리케이션을 고려하여 선택할 수 있고, 추가 비용 걱정 없이 원하는 기능을 선택할 수도 있습니다.
🌈요구 사항이 변경되면 유연한 플랫폼이 도움이 될 수 있는데요, 사용자 정의 노트북을 만들고, 기술을 추가하고, 빠르게 일어나는 변화에 앞서 나갈 수 있습니다. 전문가와 협력하여 오픈 소스 솔루션의 성숙도를 계속 확인할 수 있으므로 프로젝트 초기에는 기술을 너무 일찍 배포하지 않아도 됩니다.
2️⃣ 데이터 과학자의 성공을 위한 준비
❗️오픈소스 기반으로 데이터 과학자가 선호하는 도구들이 준비되어 있어야 하겠죠? Jupyter, PyCharm, PyTorch, scikit-learn, TensorFlow, Anaconda, RStudio 등
❗️데이터 과학자에게 실험(Experiment)할 기회(인프라 준비 등)를 빠르게 제공하는 것도 매우 중요합니다. 또한 데이터 과학자에게 배포 가능한 상황에서 모델링을 사용할 수 있는 기회를 제공하십시오. 그분들의 노력이 회사와 고객에게 어떻게 가치를 더하는지 보여주세요.
자신의 작업이 실제 운영에 어떤 영향을 미치는지 확인하면 자신이 조직에 어떻게 기여하고 있는지에 대한 더 나은 관점을 얻을 수 있습니다.😀
3️⃣ 개발자의 적극적인 참여
🌈데이터 과학 업무를 같이 하는 동료(데이터 과학자)가 생성한 모델을 쉽게 통합하는 데 도움이 되는 애플리케이션을, 개발자분들이 생성하는 데 필요한 도구를 제공해야 합니다.
🌈이미 편안하게 사용하고 있는 기술을 사용할 수 있도록 허용하고 데이터 측면에 대해 걱정할 필요가 없도록 해야 하는데요, 예를 들어 개발자는 Quarkus에서 애플리케이션 로직을 수행하고 REST 엔드포인트에 대한 애플리케이션 프로그래밍 인터페이스(API) 호출을 수행하도록 할 수 있습니다. 그러면 데이터 과학자가 실제 데이터 처리 및 예측을 처리할 수 있겠죠🤩
4️⃣협업 장려 및 지원
🌈MLOps 프로그램의 성공은 개발자, 데이터 과학자, 데이터 엔지니어가 서로 협력하는 능력에 크게 좌우된다고 볼 수 있고, 그래서 협업을 장려하는 공통 플랫폼과 도구를 제공하는 것이 핵심입니다.
🌈자동 데이터 버전 관리 및 데이터 계보(lineages)에 대한 액세스를 제공하는 Pachyderm과 같은 오픈 소스 도구를 사용하면 데이터 과학자, 엔지니어 및 개발자가 모델 변경 사항을 보다 효과적으로 추적할 수 있습니다. 이를 통해 3개 팀 간의 대화를 열 수 있으며 모든 당사자에게 처음부터 운영 환경까지 모델 상태에 대한 더 나은 정보를 제공할 수 있습니다.
5️⃣보안 강화
🌈개방적이고 유연한 플랫폼을 사용하면 클라우드 간에 워크로드를 보다 효율적으로 이동할 수 있지만 온프레미스 환경과 클라우드 환경 간에 데이터가 전달될 때 잠재적인 보안 취약성을 항상 인식해야 합니다.
❗️그래서 보안이 기본적으로 포함(baked-in)되어 있고 정기적으로 패치가 적용되는 신뢰할 수 있는 애플리케이션 플랫폼을 선택하는 것이 중요합니다. 보안이 강화되고 지속적으로 업데이트되는 Kubernetes 기반의 최신 클라우드 네이티브 애플리케이션 플랫폼은 좋은 선택입니다.
🌈그런 다음, 데이터가 어디에 있든 데이터를 보호할 수 있는 에어갭(air-gapped) 환경을 만드십시오. 격리된 네트워크나 단절된 환경을 사용하여 가장 독점적이거나 중요한 데이터를 보관하는 영역을 분리하세요.
🌈연결되지 않은 환경은 정부 기관이나 의료 서비스 제공자와 같이 민감한 정보가 많은 조직에 특히 중요합니다. 또한 일반 데이터 보호 규정(GDPR, General Data Protection Regulation), 건강 보험 이동성 및 책임법(HIPAA, Health Insurance Portability and Accountability Act) 등과 같은 데이터 공유 법률을 준수하는 데에도 중요합니다.
원본 기사(pdf) 링크는 아래와 같습니다. 감사합니다🙏
[Source Link] https://www.redhat.com/rhdc/managed-files/cl-mlsops-top-5-checklist-303865pr-202304-en.pdf
다음 내용이 궁금하다면?
이미 회원이신가요?
2023년 10월 26일 오전 5:21
1. 20대의 스티브 잡스가 했던 행동과 50대에 그가 보여주었던 효율적인 리더십을 혼동하면 안 된다.
'UT’라는 표현으로 테스트를 전부 표기하는 경우가 많은데, 두 가지를 구분해서 써야 합니다.
... 더 보기❓회사가 또 혁신안을 내놓았습니다. 이번에도 조직개편 중심의 혁신안을 내놓았지만, 사실 예전에도 시간이 지나며 흐지부지 되었습니다. 혁신이 필요하지 않다고 생각하는 건 아닙니다. 제대로 혁신해서 회사가 발전하기를 간절히 바랍니다. 그런 길이 있다면 적극 동참하고 싶습니다. 혁신은 어떻게 해야 하는 걸까요?
... 더 보기1. 파킨슨의 법칙에 따르면 어떤 일이든 주어진 시간이 모두 소진될 때까지 늘어진다고 한다.
이
... 더 보기