그래서 수많은 데이터 중 가치 있는 정보를 찾아내는 일은 아주 중요하다. 많은 사람들이 빅 데이터를 주목하고 있는 이유도 그 때문이다. 빅 데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대한 반면 생성 주기가 짧다. 형태도 수치 데이터뿐 아니라 문자와 영상 데이터를 포함해 대규모다.
아마존, 구글, 페이스 북의 광고 시스템은 잘 알려진 빅 데이터 적용사례이다. 고객의 성향과 검색구매패턴을 분석해 고객의 취향에 맞추어 광고를 띄워 준다. 특히 ‘해외직구’ 바람의 중심인 아마존은 고객의 과거 구매 내역을 분석해 적합한 상품을 자동으로 추천해 주기도 한다. 최근에는 이메일에 빅 데이터 기술을 적용해 메일의 활용성을 높이고 중요한 이메일을 자동으로 분류해 주는 기능도 제공한다. 이처럼 빅 데이터는 다양한 형태의 대용량 데이터를 빠르게 분석함으로서 교통, 통신, 금융, 의료, 유통 등 사회전반에 걸쳐 가치 있는 정보를 제공할 수 있어 국내·외 활용사례가 지속적으로 증가하고 있다.
그러나 이런 장점에도 불구하고 빅 데이터의 특성상 개인정보를 활용하는 경우가 많아 신중하게 다루어야 한다는 의견도 만만찮다. 왜냐하면 각종 CCTV와 블랙박스 차량, SNS나 스마트폰 등 디지털매체의 사용이 계속 증가하고 있는데 그에 따라 영상, 문자, 통화기록 등 엄청난 양의 데이터가 필연적으로 만들어지고 그 과정에서 개인정보의 저장이 가능해 지기 때문이다. 이러한 빅 데이터의 특성 때문에 개인정보보호의 중요성이 한층 강조되면서 빅 데이터를 활용하는 곳에서 많은 제약을 받게 되었다.
다행스러운 것은 최근 정부가 개인정보보호에 초점을 맞춰 ‘개정 정보통신망법’을 시행함으로서 프라이버시 침해를 막는 제도적 장치를 마련한 것이다. 또 지난 23일 방송통신위원회는 빅 데이터를 처리, 활용할 때 개인정보 보호와 활용을 위한 구체적인 기준을 정한 ‘빅 데이터 개인정보보호 가이드라인’을 발표하였다. 가이드라인의 핵심은 빅 데이터 처리 과정에서 수집된 데이터에 개인정보가 포함된 경우, 이를 다른 정보로 대체하거나 다른 정보와 결합해도 특정 개인을 식별하기 어렵도록 하는 ‘비식별화’ 조치가 선행된다면 수집·활용이 가능하도록 한 것이다.
늦은 감이 없진 않지만 이제 비로소 빅 데이터의 활용과 개인정보보호라는 모순(矛盾)관계의 실마리를 푸는 해법이 마련된 것 같아 그나마 다행이다. 지금 세계는 치열하게 무한경쟁을 벌이고 있다. 빅 데이터 활용에 대한 약간의 어려움과 지연은 있었지만 ‘골든타임’을 놓치지 않도록 지금부터라도 집중해야 한다. 그를 통해 현 정부가 추진하고 창조경제의 새로운 성장 동력원으로 빅데이터가 제 몫을 할 것을 기대한다.
<최희주 울산 폴리텍대 정보통신시스템과 교수>