[칼럼] 능동적인 데이터 수집·활용 프로세스 구축 통해 데이터 경제 대비해야

■ 전 세계가 목격한 데이터 공유의 파급력

코로나19 사태로 한국이 전 세계의 주목을 받고 있다. 대규모 전염 발병 관리에 대한 준비가 부족했던 각국 정부 기관들이 방역 체계 수립과 관련해 도움을 요청하고 있다. 우리나라의 코로나19 대응이 이처럼 좋은 평가를 받고 있는 이유 중 하나는 데이터의 투명성에 있다. 질병관리본부는 지난 1월 8일 첫 유증상자 발생 보고를 시작으로, 지속적인 정례 브리핑을 통해 국내 발생 현황을 투명하게 공개하고 있다.

공개하는 데이터에는 확진자의 성별, 나이를 비롯한 기본 정보와 감염 경로 및 일자별 동선이 담겼다. 이 데이터는 세계 최대의 데이터 과학 커뮤니티인 캐글(Kaggle)에서 활용돼 수십 개의 예측/분석 모델이 만들어지는 기반이 되기도 했다. 나아가 세계에서 가장 많은 30만 건 이상의 검사를 진행하며 축적된 임상 데이터는 단순 예측 모델 수립을 넘어 효과적인 방역 정책 수립과 치료제 개발에 주요한 역할을 수행할 수 있을 것으로 기대되고 있다.

바이러스의 염기서열을 담은 게놈 정보를 기반으로 전파 과정을 비롯한 역학 조사에 나선 과학자들도 있다. 국제 인플루엔자 데이터 공유 이니셔티브(GISAID)에는 현재 519건의 게놈 정보를 바탕으로 한 ‘가계도’와 확산 현황이 공개돼 있다. 투명하고 신뢰도 높은 데이터 공유가 공유될 때 얼마나 큰 파급력을 가질 수 있는지 전 세계가 실시간으로 목격하고 있는 셈이다

 

■ 공익·연구를 넘어 ‘데이터 비지니즈’로

그렇다면 공익·연구 목적을 제외한 다른 분야에서도 데이터 공유를 통한 가치 창출이 가능할까? ‘아직은 어렵다’는 것이 전문가들의 의견이다. 지난 1월 데이터3법 개정안이 통과됐지만, 이는 데이터 활용 및 유통을 위한 기반만 마련했을 뿐 자세한 활용 가능 범위나 판단 기준 등은 아직 명확하게 정의되지 않았기 때문이다.

가장 먼저 살펴봐야 할 것은 개별법 우선 적용 문제다. 개별법에 개인정보를 보호하려는 취지가 있을 경우엔 개별법을 따르도록 되어 있기 때문이다. 비식별화 조치에 대한 문제점도 있다. 일정 부분 비식별화를 했더라도 여러 산업 분야에서 모인 정보들이 조합될 경우 식별화될 가능성이 있어 이에 대비책이 필수다. 이는 의료법과 생명윤리 및 안전에 관한 법률을 따라야 하는 분야에서 가장 특히 걸림돌이 된다. 의료 데이터는 비식별화 과정을 거치더라도 이를 활용하기 위해선 심사기관의 승인, 환자의 동의, 사용 이력 추적 등이 필요하기 때문이다.

데이터의 신뢰도 역시 중요한 문제다. 이번 코로나19 사태의 경우, 질병관리본부와 일선 의료진이 검증을 통해 데이터를 축적하고 관리 및 공유한 덕분에 신뢰도를 확보할 수 있었다. 하지만 일반 기업을 비롯한 다양한 주체가 독자적으로 수집한 데이터의 신뢰도를 확보한다는 것은 매우 어려운 일이다. 이를 위해선 수집부터 데이터 활용 및 그 결과까지 일련의 모든 과정을 추적하고 관리하는 프로세스가 필수적이다.

그리고 이러한 프로세스 구축 및 운영 과정에서 블록체인이 유용하게 사용될 수 있다. 정보 활용 동의 및 데이터 유통의 전반적 내용들이 모두 블록체인에 기록됨으로써 어떤 단계에서 어떤 데이터가 활용됐는지 모두 확인할 수 있는 것은 물론, 각 개인이 언제든지 자신의 정보를 제외할 수 있는 장치 역시 마련할 수 있기 때문이다.

이번 코로나 사태를 통해 투명하게 수집되고 관리된 데이터가 공유됐을 때의 파급력을 엿볼 수 있었다. 이와 같이 성공적인 사례들을 다양한 분야에서 만들어 나가기 위해선 정부와 데이터 보유 기업, 그리고 데이터 활용 기업의 역할이 모두 중요하다.

먼저, 정부는 데이터 이용 활성화에 부합하는 하위 법령과 데이터 산업 지원책을 마련해야 한다. 데이터 보유 기업은 데이터의 수집, 분석, 가공 프로세스를 구축해야 하며, 데이터를 활용하려는 기업은 데이터 기반 비지니스 모델 수립과 함께 개인의 데이터 자기결정권도 보장해야 한다.

블록체인을 활용해 데이터의 수집, 유통, 활용 등 관련된 모든 과정이 투명하고 신뢰도 높게 기록된다면, 법령이 요구하는 최소한의 기준을 넘어 보다 선제적이고 능동적인 프로세스 구축이 가능하다. 이를 통해 생산 및 유통, 의료, 행정 등 더욱 다양한 분야의 데이터가 활용돼 부가가치가 만들어지는, 진정한 데이터 강국으로 거듭날 수 있는 기반을 마련할 수 있을 것이라고 믿는다.

관련 보고서 보러 가기

 

[글=김한석 | 블로코 콘텐츠 매니저]
[기사전문보기]
[컬럼] 크립토 블룸버그를 꿈꾸며…
블로코, 국내 블록체인 역사 담은 9번째 보고서 공개
메뉴