식어가던 AI 산업에 대한 기대와 관심을 뜨겁게 만든 ChatGPT를 시작으로 구글의 Bard, 안트로픽의 Claude, 메타의 LLaMA, 네이버의 HyperCLOVA X 등 대규모 언어 모델 (Large Language Model, 이하 LLM)들이 튀어나오고 매일같이 새로운 레코드를 찍고 있습니다.
LLM을 다루는 PM의 관점에서 AI는 놀라울 정도로 빠르게 발전하고 있지만, 사용자에게 전달되는 가치가 기술만큼 빠르게 발전하고 있느냐고 물어본다면 아니라고 답할 거 같습니다. 최종 사용자가 LLM 기반의 서비스를 이용할 때의 사용성은 여전히 불편하기 때문입니다.
순식간에 월간 사용자 1억 명을 돌파해 역사적인 기록을 남겼던 ChatGPT의 최근 활성 유저 수가 감소세에 접어든 이유 중에 하나도 이런 이유가 있지 않을까 합니다.
(물론, 아직도 어마어마한 사용자를 보유하고 있습니다.)
하지만 최근 LLM, 생성형 AI 씬에서 귀여우면서도 배울 점이 가득한 제품을 찾았습니다.
Stable Diffusion으로 유명한 stability.ai의 'Stable Doodle'입니다.
Stable Diffusion이 사람이 사용하는 plain text 기반의 프롬프트를 이용해 이미지를 생성하는 generative ai 서비스라면, Stable Doodle은 'doodle(낙서)'과 함께 간단한 프롬프트를 이용해 이미지를 생성할 수 있습니다.
둘의 차이는 작은 낙서 하나이지만 사용성의 차이는 매우 큽니다. 양궁에서 2mm의 높낮이 차이가 과녁에서 38cm의 차이가 되는 것처럼요.
Stable Diffusion은 text 기반의 프롬프트를 아주 구체적이면서 AI 감수성이 충만한 문장으로 배경부터 분위기, 피사체까지 모든 묘사를 해내야 원하는 결과를 얻을 수 있습니다. 즉, 경험치가 낮은 일반 사용자가 원하는 결과물을 얻기가 쉽지 않다는 뜻입니다.
Stable Doodle은 머릿속에 있는 이미지에 대한 투박한 낙서를 추가함으로써 상대적으로 간단한 프롬프트만으로도 내가 원하는 결과물을 얻을 가능성을 비약적으로 높여줍니다. 첨부한 이미지처럼 허접한 저의 낙서일지라도 말이죠.
재밌고 귀여운 방식으로 사용자의 허들을 낮춘 stable doodle를 보면서 LLM에서의 '낙서'는 무엇일까 고민해보게 됩니다.