인공지능(AI) 전문가들이 백악관이 보유한 코로나19 관련 29,000개 학술 논문의 데이터셋을 분석하게 됩니다. 연구자들은 해당 자료를 가지고 새로운 텍스트와 데이터 마이닝 기술을 개발해 과학자들이 주요 질문에 대한 답변을 할 수 있도록 돕습니다. 바이러스의 탄생, 전이, 치료에 대한 질문이지요. (질문은 구글의 머신러닝 커뮤니티 Kaggle에서 만들었어요. 이 커뮤니티는 질문에 가장 뛰어난 답을 내놓는 개인 또는 조직에게 상금도 수여할 예정입니다) 코로나19 오픈 리서치 데이터셋은 Semantic Scholar에서 무료로 비영리로 학술 검색 엔진에서 찾아볼 수 있습니다.
이것이 가능하려면 연구, 출판, 유통, 발행 및 이용 전 과정에서 다양한 조직이 연계돼야 해요. 백악관의 과학기술정책 부서가 요청을 했고, The Chan Zuckerberg Initiative(챈 저커버그 이니셔티브)가 사전 발행 접근권을 부여했고, 국립의학도서관에서 연구 콘텐츠를 제공했어요. 마이크로소프트는 리서치 큐레이션 툴을 제공했고 Allen Institute(앨런 인스티튜트)에서 컴퓨터가 콘텐츠를 읽을 수 있는 형태로 변형하는 작업을 했어요. 이외에도 여러 기관에서 코로나19 학술 논문을 발표했고 '오픈'했습니다.
코로나19에 당장 잘 대처하는 것이 정말 중요한 한편, 질병 관련 연구에서 자료를 오픈하고 이를 활용해 연구를 더 깊게하거나 확장하는 작업은 미래를 위한, 한단계 더 나아간 작업이라고 봅니다. 정부, 기업, 학술기관, 연구소, 재단, 이외 유관 민간 단체 등이 비상상황에 기민하게 연계하는 모습이 인상깊어요. 국내에서도 조금 더 멀리보고 미래를 위한 연구에 같이 힘을 모으면 좋겠습니다.