미래 IT기술의 전망을 할 때 최근 몇 년간 꾸준히 나오기도 하였고, 가장 많이 인용이 되서 이제는 다소 진부하다는 느낌을 주는 단어로 ‘빅 데이터’가 있다.
모바일 기술과 사물인터넷(Internet of Things, IoT) 기술이 발전하고 다양한 디바이스들이 늘면서, 동시에 소셜 등으로 사람들이 실시간으로 여러 가지 정보를 생산하고 내놓게 되다보니 수 많은 데이터들이 쌓이게 된 것이 빅 데이터 시대를 이야기하는 가장 큰 이유다.
빅 데이터에 열광하는 사람들은 이렇게 쌓인 데이터들을 분석해서 우리 사회와 비즈니스의 많은 문제를 풀어낼 수 있는 솔루션으로서의 가능성을 높게 평가한다. 이들은 데이터를 이용해서 과거보다 올바른 판단을 내릴 수 있으며, 보다 건강한 삶을 살 수 있게 한다거나, 효과적인 도시계획을 하고, 더 잘 팔릴만한 상품을 기획하며, 보다 안전한 사회를 만들 수 있다는 등의 다양한 시나리오를 이야기한다.
빅 데이터의 효용성은 기업이나 관공서에만 국한된 것이 아니다. 최근 ‘정량화된 자신(Quantified Self)’라는 개념이 널리 알려지고 있는데, 유전자 정보를 시작으로 하여 개인들이 삶을 살아가는 여러 과정을 데이터로 축적한다면 질병을 예방하고, 잠도 더 잘 자게 할 수 있고, 체중조절도 할 수 있다는 다양한 서비스나 앱들도 등장하고 있다.
조금 더 극단적인 사례도 있다. 미국 국가안보국의 경우 모든 통화 기록의 데이터를 모아서 분석한다면 테러를 막을 수 있다고 보고 있기도 하다.
빅 데이터 찬양론자들이 이야기하는 이런 다양한 사례들이나 이익은 분명히 존재할 것이다. 그런데, 뭐든지 좋기만 한 것은 별로 없는 법. 빅 데이터 시대에 나타날 수 있는 부작용에 대해서 알아두는 것도 중요하다. 부작용을 제대로 이해할 수 있다면, 대비하기도 쉬워진다. 그렇다면, 어떤 구체적인 부작용들이 있을까?
일단 제일 먼저 떠오르는 것은 프라이버시의 문제다. 빅 데이터는 결국 수 많은 기기들이나 개인들의 정보를 모아서 만들어진다.
이런 작은 데이터들이 모여서 커다란 데이터의 세트가 되면 여기에 다양한 분석기술을 적용해서 영감을 얻는 것이다. 이렇게 수 많은 디바이스와 스마트폰을 통해 수집된 데이터는 보안기능이 강력한 데이터 센터에 보관이 되는데, 컴퓨터와 저장장치, 그리고 네트워크 인프라 비용이 저렴해지면서 거의 실시간으로 이를 분석할 수 있는 환경들이 구축되고 있다.
이런 데이터를 잘 분석해서 우리에게 이익을 가져오려면 개인들의 사적인 정보를 가능한 많이 모아야 한다. 그리고, 각 개개인들이 빅데이터 분석을 통해 자신에게 맞는 정보를 얻기 위해서는 역시나 개인의 정보를 많이 활용할 수 있어야 한다. 빅데이터의 혜택을 많이 얻기 위해서는 되도록 많은 사람들이 자신의 프라이버시를 보호하기 보다는 활용하도록 동의해야 하는 것이다. 이것은 일종의 패러독스다.
한 마디로 데이터 기반의 지능적인 서비스를 받기 위해서는 지나치게 프라이버시를 주장할 수 없으며, 반대로 프라이버시를 강력하게 지키기 위해서는 되도록 데이터를 주지말고, 대신에 자신에게 필요한 정보를 얻는데 소외되는 것을 각오해야 하는 것이다. 최대한의 프라이버시를 지키면서, 최고의 빅데이터 분석의 이익을 얻을 수는 없다. 그러므로, 빅데이터 관련 서비스 제공자들은 상업적, 사회적으로도 가치있으면서, 윤리적이고, 법적으로도 큰 문제가 없는 수준의 빅데이터 활용과 개인의 프라이버시의 균형점을 찾는 노력을 할 필요가 있다.
두 번째로 우려되는 것은 개성의 상실이다. 많은 사람들의 데이터를 모아서 다양한 형태의 추천이 발생한다고 하자.
아무래도 빅데이터 분석에 의해 추천되는 것에 각 개인들의 결정은 영향을 받을 수 있을 것이다. 예를 들어 페이스북 뉴스피드는 개인들의 “좋아요”나 “댓글” 등을 분석해서 적절한 수를 알아서 보여주기도 하고 안 보여주기도 하면서 지나치게 많은 정보가 사용자들을 괴롭히지 않도록 하고 있는데, 이것이 편리한 듯 하면서도 가만히 생각해보면 시스템의 결정에 의해 나 자신이 정보를 볼 수 있는 기회자체가 봉쇄되는 것이다. 뉴스피드는 그래도 좀 낫다. 어떤 상품의 구매나 서비스의 선택, 그리고 의견 등도 자신의 성향에 맞는 것들만 골라서 노출이 되고, 이것이 축적되면 과거보다 개인적으로 조금 싫어하거나 꺼려지는 경험은 아예 할 기회가 사라지게 된다. 이것은 꽤 큰 문제가 될 수 있다.
이미 많은 사람들은 검색엔진이 골라주는 정보만 보고, 평점이 높거나 맞춤형으로 자신에게 제시된 상품만 소비하고 있다. 이렇게 되면 자신의 독자적인 선택이라는 ‘개성’에 본질적인 도전을 받게 되는 것은 아닐까?
조금 과장하자면 개인의 유전자를 통해 그의 학력이나 커리어에 대한 스크리닝을 하고 모든 것을 결정하는 영화 가타카(Gattaca)의 세계의 초입부분을 우리가 경험하고 있는지도 모른다. 개인들이 추천을 받아서 쉽게 결정을 하는 것에 익숙해져서, 자신들의 개성적인 선택을 할 수 있는 능력을 잃는 상황이 그리 허황된 SF에서의 이야기로만 생각되지는 않는다.
마지막으로 빅데이터의 특성 상 거대 기업이나 정부 등의 빅브라더의 탄생과 이들의 일반 시민들에 대한 지배력 강화에 대한 우려를 부작용으로 들 수 있다. 빅데이터 서비스를 제공하는 기업이나 공공기관들은 이런 문제에 대해 걱정하지 말라고 하지만, 이제는 데이터도 권력이 될 수 있다는 것을 감안한다면 온전히 믿을 수만은 없는 노릇이다.
이런 문제를 해결하기 위해서는 데이터의 민주화나 자유로운 활용, 시민들의 권리 등과 같은 가치나 이슈에 대해서도 이제는 고민해봐야 한다.
무엇이든 아름답기만 한 것은 별로 없다. 이는 빅데이터에 대해서도 마찬가지다. 지나치게 미래를 밝게만 보고, 있을 수 있는 부작용에 제대로 대비하지 않는다면 빅데이터가 만들어 내는 가치와 이득의 크기 만큼이나 커다란 역풍을 불러일으킬 수도 있다. 좋은 점은 최대한 취하되, 문제가 있는 부분에 대해서는 적절하게 대응을 하는 지혜가 필요하다.
P.S. 이 글은 한국일보.com의 브런치N스토리 “정지훈의 미래기술 이야기”에 지난 6월 19일에 실렸던 <‘빅데이터 사회’는 과연 정답일까> 라는 글의 내용을 블로그용으로 편집한 것입니다.
글: 하이컨셉 & 하이터치
원문: http://health20.kr/3168