HoJoong Kim

Senior IT guy

보고 듣고 말하는 AI 시대의 도래

커피팟(Coffeepot)에서 심플하게 정리한 멀티모달 관련 내용입니다. 상세 내용은 원문 참고하시면 좋을거 같네요. ^^

구글 바드(Bard)의 업데이트를 시작으로 '멀티 모달(Multi Modality)' LLM(대규모 언어 모델)의 시기가 금방 다가오면서 빅테크 간의 AI '비즈니스화' 경쟁이 벌어질 예정입니다.

멀티모달(Multi Modality)

멀티모달은 텍스트, 이미지, 영상, 음성 등 시청각 요소로 이루어진 여러 방법으로 정보를 주고받는 것을 말하는 개념이고, 이런 다양한 채널의 '모달리티(Modality, 양식)'를 동시에 받아들여서 학습하고 사고하는 AI

빅테크 업체별 사례

구글 바드(Bard)의 업데이트, 스마트폰 픽셀 8의 구글어시스턴트로 스팸전화 대신 응답 및 구글문서 등 연동
오픈AI 챗GPT에 이미지 인식 기능과 텍스트-투-스피츠(TTS(Text-To-Speech)) 기능, 이미지 생성 AI인 달리(Dall 3)
메타 레이벤 스마트 글래스에는 멀티모달 지원하는 메타 AI 기본 탑재

Hoking 생각

초거대모델 AI개발 위한 초기 인프라 투자비가 최소 1000억 이상이라고 할 정도라서 자본이 많은 빅테크 기업이 계속 시장 기술 선도 가능성
이로 인한 기술격차와 AI 양극화 극대화 가능성
-> 결국 상위 기업2~3개가 마치 안드로이드폰과 애플폰이 글로벌 모바일 시장 양분하는 것처럼 가지 않을까?
-> 스마트폰과 스마트글래스등의 여러 디바이스에 더 정확하고 양질의 멀티모달이 구현된다면 이제는 모바일에서 새로운 디바이스의 확장으로 이어지지 않을까 싶다. ^^

☕️ 보고 듣고 말하는 AI 시대의 도래

stibee.com

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 10월 10일 오전 5:33

저장 1 • 조회 1,685

함께 읽은 게시물

김하림

우아한형제들 프론트엔드 개발자

2024년 10월 19일

개발자는 개발만 잘하면 될까

최근에 친구가 추천해준 데일 카네기의 인간관계론을 읽던 중 고액 연봉을 받는 엔지니어들의 특징에 대한 흥미로운 내용이 있었다.

•

저장 13 • 조회 2,550

장홍석

스페이스오디티 부대표/CPO

3일 전

< 스타벅스 컵홀더의 손글씨가 말했다: 결국은 사람이다 >

댓글 1 • 저장 2 • 조회 520

한성규

'지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

3일 전

👋 프로세스를 촘촘하게 만드는 사람

쿠

프로세스를 촘촘하게 만드는 사람

기억보단 기록을

저장 3 • 조회 403

골빈해커

Chief Maker

5월 20일

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트 레포에 써 보았습니다.

테스트가 있으면 스스로 테스트도 실행하고, 만든거 스스로 실행해보면서 버그도 수정하고 하는게 기특하긴 합니다.

댓글 3 • 저장 7 • 조회 2,717

김소진

제니휴먼리소스 대표(헤드헌터/ 커리어코치)

하루 전

지금 당장 퇴사해야 합니다!

지

저장 1 • 조회 33

레드버스백맨

리서처 앤 라이터

2일 전

《뒤돌아보고 그때서야 아는 것》

나

저장 1 • 조회 506

비슷한 게시물

SNEW 스타트업 뉴스 start-up and VC

아이브는 샘 알트먼 오픈AI 최고경영자(CEO)와 함께 스마트폰을 대체할 'AI 하드웨어 개발 프로젝트'를 진행 중이다. 이 기기에는 오픈AI의 '챗GPT' 등 최신 AI가 탑재될

박종민 디자인 리드

애플 인텔리전스: 모두를 위한 AI

골빈해커 Chief Maker

AI로 인해 다시 한 번 더미 디바이스의 시대가 올 수도 있지 않을까 싶다.

Sohee 콘텐츠 매니저

챗GPT-4o, 완전 럭키비키잖아

김태경 펫피/디팡오투오 CMO

AI를 위한 독립된 디바이스? Rabbit R1

닥터G UX 디자이너 & 리서처

3월 IT뉴스

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

보고 듣고 말하는 AI 시대의 도래

댓글 0

함께 읽은 게시물

개발자는 개발만 잘하면 될까

< 스타벅스 컵홀더의 손글씨가 말했다: 결국은 사람이다 >

👋 프로세스를 촘촘하게 만드는 사람

지금 당장 퇴사해야 합니다!

《뒤돌아보고 그때서야 아는 것》

비슷한 게시물

주간 인기 TOP 10

추천 프로필