본문 바로가기

주변을 살피다 : D

코로나19 미리 예측한 기업 '블루닷' 창업스토리

▷  지난해 12월 31일 캐나다의 스타트업 기업 '블루닷'은  자사의 *머신러닝 알고리즘으로 중국 우한에서 신종 코로나바이러스가 발병한 뒤 서울, 도쿄, 홍콩, 마카오 등으로 확산될 가능성이 있다고 당사 서비스 고객들에게 관련 정보를 제공했다고 발표하였습니다. 이는  세계보건기구(WHO)보다 10일, 미국 질병통제예방센터(CDC)보다 6일 앞서 코로나바이러스의 발병사실과 우한시 등의 방문을 피할 것을 경고했습니다.

* 머신러닝,기계학습(Machine Learning)이란?인공지능의 한 분야. 1959년 아서사무엘은 기계학습을 “컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야”라고 정의. 즉 사람이 학습하듯이 컴퓨터에도 데이터들을 줘서 학습하게 함으로써 새로운 지식을 얻어내게 하는 분야.

'블루닷(Bluedot)'

지난 2003년 중국에서 발발한 사스로 캐나다에서 44명이 사망하자 당시 토론토 세인트 마이클 병원에서 사투를 벌였던 의사 캄란 칸에 의해 감염병 국제 확산 연구를 목적으로 10년 후 2013년에 설립되었습니다. 

기업으로서 블루닷의 가치를 알아본 건 2014년 홍콩 최고 갑부 리카싱 입니다. 리 회장의 벤처캐피탈 호라이즌벤처가 블루닷에 시리즈A 투자했고(투자금 비공개) 현재 의사·엔지니어 외에도 생태학자·수의사·수학자·데이터분석가·통계학자 등 40여 명이 블루닷에서 일하고 있습니다. 

블루닷은 65개의 언어로 발행되는 해외 뉴스· 동물과 식물 질병 네트워크·모기 등 해충현황·국제항공 예약 데이터·실시간 기후 변화 관련 데이터 등을 활용해 어떤 문제가 되는 상황이 발생하고 질병이 어떻게 확산될 있는지 예측이 가능한 알고리즘을 만들었습니다. 다만 이들은 소셜 미디어 데이터는 사용하지 않았다. 이렇게 만들어진 알고리즘은 자연어 처리를 통한 자동화 과정을 거치면 인간 전문가인 전염병 학자가 결과를 검증하고, 과학적으로 의미가 있다고 판단되면 리포트를 고객들(정부 기관, 기업, 그리고 공공 의료 기관 등)에게 보냅니다.

그는 창업 초기부터 항공 빅데이터에 주목했는데 이는 2003년 사스의 교훈을 통한 결과입니다. 항공 산업의 발전이 호흡기 감염병의 급속한 확산에 영향을 미치고 있어 칸 박사는 2008년부터 민간 항공 여행을 통한 질병 감염을 연구했습니다. 

2014년 에볼라 바이러스 때도 블루닷은 항공 여정 분석 역량을 쌓았고 당시 감염자에 대한 의료 데이터와 수십 억 건의 항공 여정을 분석해 에볼라 최초 발생지였던 서아프리카 밖으로 확산될 것을 사전에 경고했습니다. 또한 2016년 초 브라질에서 지카 바이러스가 횡행했을 때도 블루닷은 같은 방법으로 지카의 미국 플로리다 상륙을 예고하여 6개월 뒤인 그해 9, 미국 남부 플로리다에서는 임산부 84명이 지카 바이러스에 감염된 것으로 나타났습니다. 

주로 중국 정부가 확인해준 정보를 기준으로 하는 국제 기구나 미 정부보다 AI 기업의 분석이 빨랐으며 블루닷 창업자 캄란 칸 박사는 “사스 때의 데자뷰”라며 “정부가 제 때에 필요한 정보를 줄 거라고 기대하지 않는다”고 말했습니다. 

현재 블루닷의 시스템은 캐나다·싱가포르 등 세계 12개국의 정부기관 및 의료기관에서 사용하고 있습니다.


소셜 미디어 데이터가 사용하지 않는 이유 ?

전세계 최대 인터넷기업 구글은 이번 신종코로나바이러스 사태에 별다른 움직임이 없습니다. 사실 빅데이터를 통한 감염병 예측 시장엔 구글이 먼저 발을 들였는데 지난 2008년 구글은 독감 현황과 전파 경로를 지도에 보여주는 ‘구글 플루 트렌드(GFT)’를 내놓았습니다.구글 검색 엔진에서 얻은 빅데이터에 기반하여 사람들이 아프면 '감기' 나'독감' 같은 검색어 입력이 늘어나고, 이를 분석하면 독감 발생 지역을 실시간으로 파악하는 방식이었습니다. 
 
그러나 2013년 구글의 독감 예측은 크게 엇나갔는데 그해 1월 미국에서 독감이 크게 유행했고 구글도 발병률 수치를 공개했는데, 실제 발생률은 그 절반에도 못 미쳤습니다(오차 140%). 뉴욕시가 '독감을 주의하라'는 보건 경보를 발령하자 구글에서 독감 관련 검색이 폭증했는데, 이것이 실제 증상이 나타난 환자들의 검색으로 분석에 반영된 이유였습니다. 공포·호기심 같은 인간 심리의 변화를 걸러내지 못한 결과였고 서비스는 조용히 중단되었습니다.
 
블루닷이 SNS 데이터를분석에 반영하지 않는“신뢰도가 떨어진다”는 이유입니다.