ChatGPT 대항마로 구글이 지난주에 조심스러운 실험버전 (영어만 지원, 미국과 영국에서 초대된 사용자 대상)을 바드 Bard를 론칭했지요.
미국과 영국에 있는 제 동료 PM들이 사용해 본 소감/피드백/의견을 나누었는데, 그것을 정리해서 Bard에 어떤 장점이 있고, 어떤 부분이 쫌 까리한지 알려드릴까 합니다. (물론 개인적 견해라는 것은 다 감안해 주세요)
1. 속도
속도는 매우 빠르다고 합니다. 같은 질문을 했을 때 Bard는 약 10초 정도에 만들어 낸 답을 ChatGPT는 약 2분 정도가 걸렸다네요. 또한 크게 눈에 띄는 다른 점이 있다면, ChatGPT는 사람이 워드프로세서를 쓰듯이 문장이 오른쪽으로 커서가 움직여 가면서 쭈루륵 쭈루륵 만들어지는 대신에 Bard는 거의 한 장에 해당하는 대답을 원샷에 만들어낸다고 합니다.
물론 이건 현재 Bard는 소수의 초대받은 테스터들만 사용하고, ChatGPT는 세계 각국의 언어를 쓰는 최대 1억 명의 사람들이 지속적으로 사용하는 시스템이니 절대적인 비교는 할 수 없는 상황입니다.
2. 면책조항 (Disclaimer)
지난번 파리에서의 실수가 정말 큰 트라우마가 된 것인지 굉장히 많은 다음과 같은 기능제한/면책 조항이 있다고 합니다.
a) 코드 작성이 안됨
"바드는 아직 코딩을 도와줄 수 없습니다. 아직 코딩을 배우는 중이며 코드에 대한 답변은 현재 공식적으로 지원되지 않습니다."라고 합니다.
b) 악의적이고 위험한 답변을 방지하는 '안전 제어 기능'
매우 중요한 포인트인데요. Bard가 응답을 거부하는 것으로 보이는 한계는 부정확한 사실에 대해서나, 자신의 능력을 넘어서는 응답을 하는 경우가 아니고, 무엇인가 매우 조심하고 있다는 느낌이랍니다.
ChatGPT는 일반적으로 사용자가 요청하는 거의 모든 작업을 시도하고 수도 없이 틀리고, 교묘하게 거짓말도 꾸며하는데 반해, 바드는 조금만 교묘하거나 민감한 질문에 대해서는 매우 익숙하게 "아니요"라고 응답하거나, 간단하게 자신의 능력을 벗어난 작업이라고 응답을 한답니다.
그런데!! 이게 사용하는 사람이 무엇이 되고 무엇이 안되는지를 파악하기 힘들 정도로 룰이 없다고 하네요. 어떤 때는 대답을 해주고 약간만 질문을 바꿔도 대답을 못해준다고 하고 한답니다.
사실 위험한 답변의 순위와 그 판정을 어떻게 하는지는 늘 책임/신뢰/윤리가 정해져야 하는 부분이라 아직 이야기가 많이 되어야 할 듯 합니다.
3. 응답의 품질
위의 3번에서 이야기드렸듯 너무 조심스러운 Bard다 보니, 정답이라고 생각되는 응답의 품질이 너무나 평범하고 일반적이어서 매력이 없다고 합니다. 이것을 동료 PM은 이렇게 표현하더군요. 응답 내용이 독창적이고 도움이 되는 내용이라기보다는 구글 검색 상위 페이지에서 가져온 데이터를 요약한 것 같은 느낌이다 라구요.
ChatGPT는 명확하게 서론, 본론의 서술, 결론이 있는 게시물로 응답하고, 유용하다고 느낄 수 있는 내용이고, 설사 그 안에 구라가 포함되어 있다고 해도 (잘 눈치채기도 쉽진 않지만) 가장 중요한!!! 질문의 의도에 맞는 응답을 하는데, Bard는 그냥 교과서를 읽는 기분이었다고 하네요. 굉장히 중요한 포인트 같아요.
4. 인터페이스 첨부한 이미지와 같이 ChatGPT와 대동소이하게 깔끔한데, 다른 점이 있다면 챗팅 히스토리 목록이 없네요. 저는 ChatGPT를 사용하면서 이 히스토리 목록이 꽤나 유용하던데, 왜 없는지 모르겠습니다. 그냥 기존의 구글 검색을 사용한다는 느낌이랍니다.
------
총정리(Wrap-up)
- ChatGPT와 비교하면 '쫌 글쎄...'라는 반응입니다.
- 너무 보수적이고 안전에 민감해 보여서 날개가 잘려진 '대답'이라는 느낌이랍니다. '아니요, 안됩니다'가 매우 익숙하답니다.
- 어쩌면 Bard는ChatGPT 와 같은 시장을 목표로 하지 않는것 같다는 의견도 있었습니다. 다목적 모델을 구축하고 있는 ChatGPT와 경쟁하지 않고, 구글은 기존의 수익성이 높은 검색 비즈니스에 제너레이티브 AI를 구축하면서 정확도를 높이고 시장을 수성하는데 집중하고 있는 것으로 느껴진다는 의견도 있었습니다. (저도 설명을 듣고 이 부분에 크게 공감을 하게 되었답니다.)
-즉 일반적인 오피스프로덕트에 들어가는 생산성, 코딩, 이미지, 음악 이런 부분은 ChatGPT에서 주고, 검색에서 만큼은 수성을 하려나 본데, 최근의 ChatGPT의 Bing을 이용한 플러그인 브라우징 지원 때문에 약간의 멘붕은 생기지 않았을까 합니다.
---
여하튼 제가 직접 사용해 보았으면 좀 더 생생하게 소감을 말씀드렸을 텐데, 한 다리를 건너다보니 조금 느낌이 떨어지는 부분도 있지만, 그래도 첫 번째 사용 스냅샷으로는 나쁘지 않아 보입니다.
여러분들 고견은 어떠신가요?