머신러닝 분산처리는 ‘래블업’에 맡기세요

“처음 사업을 시작할 때 이건 한국에서 망하겠다 싶어서 영문 버전만 만들었어요. 개발자는 보통 영어를 잘 하니까요.” 본격적으로 사업을 하기전 텍스트큐브도 오픈소스로 만들었지만 기술노출 위험에도 불구하고 나름의 성공을 거둔 터였다. 어차피 인공지능 관련 산업은 기술기업이 대부분인 만큼 시장이 커져야 안 망하는 사업이다. 일단 퍼져야 한다란 신념 하나로 여기까지 왔다. 그렇게 오픈소스 공개 후 1년이란 시간이 흘렀다. 그리고 지난 6월 케이큐브벤처스와 스톤브릿지캐피탈로부터 20억 원의 투자를 유치하게 된다.

머신러닝 분산처리 기술로 PaaS(Platform as a Service) 분야 플랫폼을 개발하는 래블업의 이야기다. 래블업의 신정규 대표는 ‘잡일이 많은 직군에 있던 세명이 모여서 만든 회사’라고 정의했다. 박사 과정에서 연구실에 틀어박혀 살던 시절 힘들고 지루한 일을 좀더 쉽게 해결하자는 취지에서 연구실의 Lab과 개선의 Upgrade 두 단어를 합쳐 ‘래블업’을 만들었다. 세명 모두 게임을 좋아해 레벨업이란 중의적인 의미도 함께 담았다.

요리도 조리 과정 보다는 재료의 밑작업 손질인 프랩(prep)이 훨씬 길고 손이 많이 간다. 연구 과정도 마찬가지. 연구를 위한 데이터를 모으는 일은 일일이 수작업으로 분류해야 하는 경우가 많아 상당히 노동집약적인 부분이 많다고 한다. 나중에 이런걸 처리하는 회사를 만들어야겠다는 생각은 연구원 시절부터 떠올린 사업 아이디어였다.

회사를 세울 당시에는 신 대표를 지인인 두명이 모두 박사나 박사 후 연구원 과정(PostDOC)에 있었다. 학교 때문에 사는 곳도 달라서 지난해 중순까진 원격 근무를 할 수 없었다. 서울, 대전, 포항에 각각 살고 있어서다. 나머지 두명이 상경해 서울에 둥지를 트게된 계기는 데모데이 우승 때문이었다. 코드온웹(Code on Web)이란 인공지능 기반 코딩 교육 플랫폼이다.

사실 코딩 교육 플랫폼은 그들의 로드맵에 있는 프로젝트가 아니었다. 1차 위기는 생각보다 빨리 그들을 찾아왔다. 창업 후 몇달만에 분산처리 프로토타입은 개발이 끝났지만 UX, UI가 없어 고객과의 접점이 없었던 시기였다. 엔젤투자를 받기 위해 교수님을 비롯해 지인을 찾아 나섰는데 어느 투자자에게 “너희의 플랜B는 뭐냐?”란 질문을 받았고 이후 코딩 교육 플랫폼인 ‘코드온웹(CodeonWeb)의 개발을 하게된 계기가 됐다.

덕분에 머신러닝 분산처리 플랫폼인 ‘백엔드닷(Beckend.)AI’ 역시 버젓이 세상에 나올 수 있게 됐다. ‘먹고 살기 위해’ 궁여지책으로 개발한 코드온웹이 시쳇말로 ‘하드캐리’했다. 래블업이 개발한 프론트엔드 코딩 강의 프로그램은 지난 2년간 지금까지 버틸 수 있는 원동력인 동시에 회사를 알리는 수단이었다.

머신러닝 분산처리 플랫폼을 만들어 주위에 알릴 때는 별 반응이 없었지만 코딩 교육은 반응이 꽤 괜찮았던 시기였다. “당시 출시한 구글의 텐서플로우로 엔진을 바꾸고 홍보하던 시기였는데 다들 무덤덤한 반응이었죠. 그런데 어느날 갑자기 사무실에서 연락이 왔어요. 자그마치 트래픽이 16만%가 늘었다고 말이죠.”

운칠기삼이라 했다. 그날이 바로 1년반전 구글의 알파고가 이세돌 9단을 불계승으로 이겼던 날이다. 그날 이후 예전에 별로 관심을 갖지 않았던 곳에서도 다시 연락이 와서 “아직 머신러닝을 하느냐?”라는 질문을 수없이 받았다고 한다. 사업은 타이밍이란 누군가의 말이 맞았다.

래블업의 역사는 알파고의 승리 전후로 정확하게 나뉘었다. 알파고 사건(!) 이후 순풍을 탄 건 당연한 일. 작년 11월에 발표한 백엔드닷.AI의 버전 0.1 오픈소스 공개 이후 1년만인 올해 11월 초에는 정식 버전인 1.0 버전을 선보였다. 초기 프로젝트명은 소르나(sorna)였다. 영화 쥬라기공원2에 나오는 공장섬 이름이다.

미지의 영역에 도전해 새로운 것을 만든다는 나름의 의미를 갖고 있었지만 구글의 멘토링 프로그램인 엑스퍼트 서밋을 통해 만나게 된 구글러의 의견은 달랐다. 만나자마자 처음으로 그들의 낸 의견이 ‘서비스명을 바꿔라’였다고. 소르나를 구글로 검색해 보니 성적학대 모니터링 기관을 칭하는 이름이었다.

클라우드 환경에서 분산처리를 통한 머신러닝을 지원하는 회사는 많다. 대표적으로 구글, 아마존, MS 등을 꼽을 수 있다. 하지만 이런 외부 플랫폼은 보안 문제에 발목을 잡히기 일쑤다. 데이터를 공공장소에 못 올리는 경우가 많아서다. 특히 개인정보와 관련된 의료 데이터가 그렇고 보안 문제로 대기업 역시 사용하기 꺼려한다.

래블업의 백엔드닷.AI 플랫폼은 오픈소스다. 사용자는 이런 서비스를 사용하기 위해 래블업에서 배포하는 플러그인을 개발툴에 설치만하면 된다. 물론 라이선스 문제 없이 본인이 직접 설치해 연구, 교육, 의료 목적으로 쓸 수 있다. 폐쇄된 자체 서버를 이용할 수 있어 법적인 제약도 없다.

인터뷰 자리에서 MS 비주얼 스튜디오에서 파이썬 스크립트로 짠 텐서플로우 API 처리를 시연했는데 신형 맥북프로 보다 약 6배 빠른 처리가 가능했다. 맥북 프로에 없는 GPU를 클라우드 서버에 있는 NVIDIA 쿠다(CUDA) GPU가 대신 처리해 가능한 일이다.

다양한 규모의 환경에 대응이 가능한 것도 장점 중 하나다. 하드웨어 리소스를 충분히 갖춘 대기업이나 공공기관에서는 배포한 오픈소스를 깔아 자체적으로 구동을 하면 된다. 이에 비해 상황이 여의치 않은 개인 사용자는 모든 하드웨어 리소스를 지원하는 래블업의 자체 클라우드 서버를 이용하면 된다.

개인 장비에 추가로 래블업의 클라우드 서버를 더해 일정 기간 사용하는 것도 가능하다. 스타크래프트 게임을 빗대 표현하자면 일종의 ‘스팀팩’이다. 고가의 하드웨어를 단기간 쓰기 위해 구입하는 건 주머니 사정이 넉넉치 못한 소규모 회사나 개인에게는 적절한 선택지가 아니다.

“인공지능 관련 분야는 앞으로도 100배 이상 커질것 같아요” 골드러시가 열렸는데 지금 금광에 들어가는 게 맞는 일일까? “사용자는 꽃길만 걸으면 된다”고 서 대표는 말한다. 사용자는 금광 입구에서 청바지나 곡괭이를 팔면 된다는 얘기다. 금광 안에서의 궂은일은 자기들의 몫이라는 말과 함께.