이도행

라인게임즈, 테크니컬 디렉터

ChatGPT는 이미 Turing Test를 박살냈다.

2020년대만해도, 튜링테스트는 AI를 측정하는데 있어 최후의 방어벽 같은 역할을 했었습니다. 실제로 높은 점수를 기록한 AI들은 있었어도, 검증 자체를 통과한 적은 없었습니다.

허나, GPT-4가 나온 이후 튜링테스트는 더이상 AI를 검증하는데 사용되기 어렵다는 글입니다.

GPT-4는 이미 튜렝테스트를 확실하게 통과했고, 대화 능력이 너무 능숙해져서 인간의 반응과 구별하는 것이 어려워졌습니다. 이로 인해 동시에 새로운 AI 평가방법이 대두되어야 한다는 Nature에 실린 글입니다.

아마도 AI가 더욱 발전함에 따라, AI의 인지적 강점이나 약점에 대한 통찰력을 얻기 위한 새로운 벤치마킹 방법을 개발하는 것도 하나의 과제라고 이 글에선 이야기합니다.!

Next Turing Test는 무엇이 될까요?

ChatGPT broke the Turing test - the race is on for new ways to assess AI

Nature

더 많은 콘텐츠를 보고 싶다면?

이미 회원이신가요?

2023년 11월 24일 오전 12:43

저장 3 • 조회 2,570

함께 읽은 게시물

기묘한

트렌드라이트 발행인

5월 13일

👰청첩장 점유율 60% 이상, 바른컴퍼니의 핵심 경쟁력은

변

예비부부 3쌍 중 2쌍 택했다…55년 청첩장 파는 이 업체 비결 [비크닉] | 중앙일보

중앙일보

저장 3 • 조회 434

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

2일 전

알람 소리에 반사적으로 일어나서 준비를 마치고 정신없이 이동하면 어느새 사무실 책상에 앉아 있게 됩니다. 동료들과 인사를 마치고 컴퓨터를 켜는 순간 업무는 시작되지요.

직장 다니면서 제대로 ‘현타’ 맞는 순간 7

다음 - 피플앤잡

저장 2 • 조회 495

이원형

라인플러스 소프트웨어 엔지니어

5월 21일

고용노동부가 주관하는 청년미래플러스 사업, 이전에 공유했었는데요.

청년미래플러스 참여 재직자 1기 모집

한국소프트웨어산업협회

저장 5 • 조회 2,350

동크루트

AI 엔지니어, SW 엔지니어

2일 전

AI 시대에 갈피 못잡던 구글의 역습

실

AI 시대에 갈피 못잡던 구글의 역습 : 오호츠크 리포트

55check.com

저장 5 • 조회 1,411

진용진

Product manager

3일 전

PM이 이해하면 좋은 지표 개념

프로덕트 매니저(PM)로 일하면서 늘 지표 이야기를 듣게 됩니다. 대부분 PM은 선행지표(leading indicator)와 후행지표(lagging indicator)의 개념을 잘 이해하고 있습니다. 하지만 선행지표에 영향을 미치는 '인풋(input) 지표, '아웃풋(o

댓글 1 • 저장 32 • 조회 1,008

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

5월 13일

최근 어떤 기업의 창업자가 고향 주민들과 지인들에게 최대 1억 원씩 총 1,400억 원을 나누어 주었다는 언론 보도가 화제가 되었다. 우리나라에서 흔치 않은 ‘나눔’의 사례로 창업자가 도움받았던 사람들에게 보은하는 ‘감사의 정신’을 실천한 것이다.

기업가와 장사꾼의 차이 | 한국일보

한국일보

저장 2 • 조회 766

비슷한 게시물

서지연 개발자

프롬프트 엔지니어링은 죽었다?

골빈해커 Chief Maker

간밤에 OpenAI의 개발자 행사가 있었는데요. 4o로 데이터를 생성해서 4o-mini를 파인튜닝하는 파이프라인이나 평가 툴, ChatGPT Advanced Voice Mode를

골빈해커 Chief Maker

OpenAI의 연구원의 말에 따르면, LLM 모델의 파라미터의 대부분은 단순한 지식을 담고 있을 뿐이라서 추론 능력을 향상 시키기 위해 모델의 크기를 더 키울 필요는 없다고 합니다

골빈해커 Chief Maker

📰 OpenAI, 50% 저렴한 Batch API 출시

골빈해커 Chief Maker

AI계의 아이돌 Andrej Karpathy의 말에 따르면, LLM의 할루시네이션은 버그가 아니라 기능이라고 합니다. LLM은 항상 꿈을 꾸고 있는 상태다라고 표현을 했는데요.

골빈해커 Chief Maker

어떤 새로운 기술이(요즘은 대부분 AI) 나왔을 때 사람들의 반응은 두 가지로 갈린다.

주간 인기 TOP 10

달레 Apollo GraphQL Software Engineer

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

김하림 우아한형제들 프론트엔드 개발자

타입 안전한 API 모킹으로 프론트엔드 생산성 높이기

Arawn Park Senior Engineer & Engineering Lead

나는 시스템 빌더이다

석민 커리어 코치

이직의 조건

골빈해커 Chief Maker

어제 출시된 따끈따끈한 ChatGPT Codex를 실제 프로젝트

동크루트 AI 엔지니어, SW 엔지니어

샘 알트만: "지금 당신이 o3보다 더 똑똑하다고 생각하세요?"

장홍석 스페이스오디티 부대표/CPO

< '네이버 다녀요'라는 말에 아무도 무슨 일을 하는지는 묻지 않

장홍석 스페이스오디티 부대표/CPO

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와

송요창 배민 프론트엔드 프로그래머

ChatGPT 버전명 설명

레드버스백맨 리서처 앤 라이터

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것

ChatGPT는 이미 Turing Test를 박살냈다.

댓글 0

함께 읽은 게시물

👰청첩장 점유율 60% 이상, 바른컴퍼니의 핵심 경쟁력은

AI 시대에 갈피 못잡던 구글의 역습

PM이 이해하면 좋은 지표 개념

비슷한 게시물

주간 인기 TOP 10

추천 프로필