이명진

한국레드햇 솔루션 아키텍트

OpenAI의 Sora 3분내로 소개하기

최근에 OpenAI에서 ChatGPT, DALL-E에 이어 Sora를 출시하였는데요. 몇 분도 아니고 몇 초내로 동영상을 만들어 준다는 Sora가 무엇인지 3분 내로 소개하는 좋은 기사 공유합니다.😃

<Sora 소개 — 사실적인 60초 클립을 위한 OpenAI의 텍스트-비디오 모델>

Sora는 텍스트 설명에서 바로 사실적인 비디오를 생성하는 생성형 비디오(generative video)입니다.

Sora의 작동 원리

Sora는 정적 노이즈(static noise)로 시작한 다음 시간이 지남에 따라 이상 현상을 제거하여 프레임별로 일관된 비디오 영상을 형성하는데요, Output이 정말 현실적으로 나온다고 합니다.
Sora는 GPT 언어 모델과 유사한 트렌스포머(stransformer) 아키텍처를 사용하는데요, 이를 통해 이전 비디오 합성(synthesis) 모델에 비해 뛰어난 스케일링 성능을 제공한다고 하네요.
특히 Sora는 비디오를 순차적으로 스트리밍되는 이미지인 시각적인 "패치(patches)"로 처리합니다.
이러한 패러다임 전환으로 인해 단일 이미지를 입력으로 사용하는 접근 방식보다 더 높은 비디오 품질과 더 빠른 렌더링이 가능해졌습니다.

Dall-E 및 GPT 기능 확장

DALL-E 이미지 생성 및 GPT 언어 이해를 기반으로 Sora는 설명(descriptive) 텍스트 프롬프트를 활용하여 비디오 요청을 밀접하게 일치시킵니다.
Still photo을 전달하면 Sora가 시각적 콘텐츠를 기반으로 사실적으로 애니메이션을 적용하고, 이러한 inch AI로 인해 시각적 세계의 다양성을 진정으로 파악하고 시뮬레이션이 가능해 졌습니다.
처음에 OpenAI는 더 많은 실제 테스트와 피드백을 허용하기 위해 시각 예술가, 디자이너 및 영화 제작자에게 액세스 권한을 부여하였습니다.

Sora의 단점

복잡한 장면에 있어서는 물리학으로 인한 어려움이 있다고 합니다.
먹고 있는 쿠키임에도 물린 자국이 없습니다.
왼쪽/오른쪽 방향을 혼합합니다.
카메라의 지시를 항상 정확하게 따를 수는 없습니다.
Sora 비디오는 매우 사실처럼 보이지만 시간이 지남에 따라 더 미세한 세부 사항을 정확하게 시뮬레이션하기 위한 작업은 여전히 남아 있습니다.

Sora의 보안(safety) 이슈 해소를 위한 노력

잠재적인 오용에 대한 전문가 "레드팀" 테스트
허위/오해의 소지가 있는 콘텐츠를 탐지하는 도구
AI 생성 동영상에 라벨을 붙이는 메타데이터
Sora 비디오 요청에도 DALL-E와 같이 폭력, 증오심 표현 등에 대한 이미지 프롬프트를 필터링

원본 기사 링크는 아래와 같습니다. 감사합니다🙏

[Source Link] https://medium.com/the-ai-explorer/introducing-sora-openais-text-to-video-model-for-realistic-60-second-clips-162b0a21b787

Introducing Sora - OpenAI's Text-to-Video Model for Realistic 60-Second Clips

Medium

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 2월 27일 오전 1:12

저장 2 • 조회 1,470

함께 읽은 게시물

석민

커리어 코치

2일 전

스펙을 뛰어넘는 힘

저장 9 • 조회 790

Arawn Park

Senior Engineer & Engineering Lead

6일 전

첫 회사보다 중요한 것

우

- YouTube

브런치스토리

•

저장 40 • 조회 2,711

장홍석

스페이스오디티 부대표/CPO

2일 전

< 당신은 소비자인가, 생산자인가? >

댓글 1 • 저장 2 • 조회 564

우디디자인랩

대표ㅣ프로덕트 디자이너

5일 전

스테지별 지원 전략

평가 기준은 회사가 아니라

저장 2 • 조회 698

레드버스백맨

리서처 앤 라이터

하루 전

⟪커피챗 중독자의 커피챗 후기⟫

제

What is YEJI doing? : 네이버 블로그

blog.naver.com

저장 3 • 조회 815

레드버스백맨

리서처 앤 라이터

2일 전

⟪스스로를 경계하기 위해 정답을 피하는 사람⟫

베

광고바보 이제석 : 20년차 현역의 고백 “반복하면 실력은 는다, 그게 문제다”

LongBlack

저장 3 • 조회 603

비슷한 게시물

HoJoong Kim Senior IT guy

[IEEE] 지금 바로 사용할 수 있는 5가지 AI 동영상 생성기

HoJoong Kim Senior IT guy

[IEEE] 혁명을 넘어 진화의 시대에 접어든 5가지 AI 이미지 생성기

소성은 Gen AI Field Solution Architect @ Google

StabilityAI 의 stable video 3D

김영욱 SAP France 프로덕트 매니저

<어도비 프리미어프로의 (발표 예정)생성형 AI 기능>

골빈해커 Chief Maker

OpenAI가 동영상 생성 모델인 Sora를 서비스로 오픈했습니다. 요즘 동영상 생성 서비스가 많이 나오고 또 성능이 매우 좋아져서 당장 아주 특별히 좋은가? 라는 느낌이 크게 오

골빈해커 Chief Maker

KWAI에서 발표한 동영상 생성 모델 KLING이 OpenAI의 Sora의 성능에 준하거나 뛰어넘는 성능으로 사람들에게 놀라움을 주고 있는데요.

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

진짜 1인 개발자 전성시대

황경찬(Boaz) P.E.C CEO

혹시 Claude 나 cursor 등 AI 로 개발하실 때 뭔가

골빈해커 Chief Maker

이력서 노션으로 절대 쓰지 마세요.

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

“무엇을 만들까”보다 “왜 해야 하나요?”를 묻는 사람들, 토스페

장홍석 스페이스오디티 부대표/CPO

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

달레 Apollo GraphQL Software Engineer

🍜 짜파게티가 왜 거기서 나와?

psmon 블룸에이아이 서버 엔지니어

액터모델을 이용 이벤트소스/클러스터상태관리를 우아하게하기 - 코틀

Arawn Park Senior Engineer & Engineering Lead

첫 회사보다 중요한 것

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

토스 데이터 직군 집중 채용 - 면접만 봐도 100만원!

우디디자인랩 대표ㅣ프로덕트 디자이너

면접에서 진심을 보여주는 마지막 질문

OpenAI의 Sora 3분내로 소개하기

댓글 0

함께 읽은 게시물

스펙을 뛰어넘는 힘

첫 회사보다 중요한 것

< 당신은 소비자인가, 생산자인가? >

스테지별 지원 전략

⟪커피챗 중독자의 커피챗 후기⟫

⟪스스로를 경계하기 위해 정답을 피하는 사람⟫

비슷한 게시물

주간 인기 TOP 10

추천 프로필