빅데이터와 인공지능이 의미하는 것

[ZDNet Advanced Computing Conference 행사 참관 후기] 

2016년 7월 5일, 지디넷 코리아가 주최하는 Advanced Computing Conference(ACC)가 열렸다. 자사 제품들을 소개하는데 주력했던 세션들은 제외하고, 클라우드 및 빅데이터, 인공지능의 중요성을 강조했던 키노트 세션을 중심으로 주요 인사이트를 정리해보고자 한다.

ZDNet ACC 행사 전경
ZDNet ACC 행사 전경

최근 IT트렌드의 핵심은 ‘디지털 파괴(Digital Disruption)’

기존의 판을 깨는 Disruptive한 기술은 산업까지 변화시키고 있다. 2005년~2015년까지 지난 10년간 전환을 주도한 가장 큰 동인은 ‘스마트폰’이었다. 2015년 이후부터 향후 10년은 ‘인공지능이 내재된 Something’이 전환을 주도하게 될 것이라는 데는 이견이 없다. 그 형태가 서비스던 제품이던 지능화 모듈이 탑재된 무언가가 향후 10년의 변화를 이끌어 갈 것이라는 얘기다.

주요 IT 기업들은 점차 빅데이터 분석을 통해 얻어낸 것들을 지능화해서 모듈화하려는 움직임을 보이고 있다. 지금까지는 유저가 스마트폰에서 무언가를 실행했다면, 앞으로는 앱에 기반한 개인 비서 서비스가 유저에게 무언가를 예측해주고 제안해주는 수준까지 향상될 것이다.

우리가 앞으로 관심 가져야 하는 영역은 ‘지능화’

실제 주요 IT 기업들은 인공지능을 미래의 핵심기술로 정의하고 플랫폼化에 박차를 가하고 있다. 선도업체인 Google의 Sundar Pichai CEO는 앞으로 모바일 중심의 시대(Mobile-First)가 지나고 인공지능의 시대(AI-First)가 올 것이라고 언급한 바 있다. 지난해 말에는 Google의 핵심 서비스 50여 종에 쓰이는 머신러닝/딥러닝 알고리즘인 TensorFlow를 공개해 주목을 받다. 특히 Tensorflow에 특화된 TPU(Tensor Processing Unit)라는 GPU 칩까지 직접 만들어 내재화할 정도로 자신들의 인공지능 생태계를 만들어 선순환 구조를 구축하려 하고 있다. Tensorflow에 있어 알고리즘도 중요하지만, 결국 중요한 것은 빅데이터다

(Facebook, Amazon, Apple 등 주요 사업자들도 AI 기술 기반 업체 인수에 열을 올리는 등, 독자적으로 AI 생태계를 구축하고자 하는 움직임을 보여주고 있음)

머신러닝과 딥러닝의 차이는 자가 학습 기능에 있다. 머신러닝은 사람이 정보를 분석하고 특성을 모델링 해 기계를 학습시키는 반면, 딥러닝은 인간의 사고방식을 기계가 모방해 기계 스스로 수 많은 정보에서 지식을 구성해가는 것이다. 주어지는 정보량이 많을수록 성능이 지속적으로 향상되기 때문에 딥러닝에서는 빅데이터가 더더욱 중요하다.

사람의 고유 영역인 자가 학습 기능, Logical Thinking Process 등을 컴퓨터에 모델링해 놓은 것이기 때문에, ‘딥러닝’을 이해하기 위해서는 ‘뇌과학’에 대한 이해도 필요하다.

인공지능은 ‘빅데이터’의 발전에 기반하고 있으며, 이를 처리할 수 있는 인프라는 ‘클라우드’밖에 없음.  즉  데이터와 클라우드는 피할 수 없는 트렌드로, 산업계에도 확대/적용되고 있음

Industrial IoT 영역은 GE가 주도하고 있다. GE가 보유한 자사 엔진, 터빈, CT/MRI 등 의료 기기에 센서를 부착해 클라우드 기반으로 데이터를 분석하고 모니터링함에 따라 이슈 발생시 효과적으로 대응할 수 있게 한다. 이러한 노하우를 패키지화해 Predix 플랫폼으로 판매하고 있다. 이처럼 데이터를 기반으로 지능화해서 기기 및 생산라인에까지 확장하는 것이 Industry 4.0의 핵심이다.

IBM은 Watson을 적용할 주력 산업으로 기존의 의료 및 교육 산업에서 더욱 확대해, 금융, 기상/날씨정보 산업을 선정하는 등 그 영역을 확장해 나가고 있다. 딥러닝에 필수 요소인 데이터를 확보하기 위한 Truven Health Analytics(환자 및 의료 데이터), The Weather Company(날씨 및 기상 데이터) 인수를 추진하기도 한다. 딥러닝을 기반으로 하는 인공지능의 성능은 데이터 양에 의해 결정되므로 초기에 생태계 참여자를 많이 확보하는 것이 선제적으로 인공지능 플랫폼 경쟁에 대응할 수 있는 방안이다.

빅데이터가 대중화됨에 따라, 빅데이터의 활용 방법이 쉬워지고 있음

클라우드와 빅데이터가 만나면 1) 대규모의 인프라를 저렴한 가격에 빨리 사용 가능하며, 2) 관리 운영이 필요 없고, 3) 빅데이터 분석이라는 본연의 업무에만 집중할 수 있는 장점이 있다. 클라우드 기반 빅데이터 분석 서비스인 Google의 BigQuery의 장점도 No-ops, Scale, Cost, Performance 등이 꼽힌다.

이러한 서비스의 등장으로 빅데이터의 활용 방법이 점차 용이해지고 있다. 이제는 빅데이터를 만드는 시대가 아니라, ‘가져다 쓰는 시대’다. 즉, ‘빅데이터 활용’에 집중해야 한다. 최근 Google이 머신러닝 플랫폼을 공개했는데 Vision API, Speech API 등을 잘 활용하는 게 중요하다. Google이 지난 2014년 인수한 Firebase는 모바일 앱 분석 플랫폼(Google Analytics의 앱 버전)인데, 이를 활용하면 A/B testing도 쉽게 되고 개발자 자신의 앱뿐만 아니라 다른 앱까지 분석한 인사이트를 알려주기도 한다. 이렇게 좋은 Tool들을 빠르게 발견하고 잘 활용해 Front-end 개발에 집중하고 있는 업체들이 진정 똑똑한 스타트업이다.

원문