데이터 라벨링 ‘크라우드웍스’, 주요 지표 공개

인공지능 학습 데이터 플랫폼 크라우드웍스(대표 박민우)가 신축년 새해를 맞아 지난해 주요 서비스 지표를 담은 인포그래픽을 공개했다.

올해로 설립 5년차를 맞이한 크라우드웍스는 업계 최초 ‘크라우드소싱’ 방식의 인공지능 학습 데이터 플랫폼을 선보이며, 시간과 제약이 없는 양질의 일자리 창출과 솔루션 고도화에 필요한 데이터를 국내외 시장에 제공해 왔다.

지난해 크라우드웍스에 가입한 신규 회원수는 총 11만명으로 하루 평균 300명 이상 증가한 것으로 나타났다. 지난해 1월 10만명을 기록한 누적 회원수도 1년 사이 두배 이상 증가하며 20만명을 돌파했다. 관계자에 따르면 이는 업계 추산 국내 데이터 라벨러의 80%를 차지하는 수준으로 국내 최대 규모이다.

크라우드웍스는 이러한 성과를 인정받아 과학기술정보통신부가 주최하는 ‘벤처 및 중소기업 활성화 유공 장관 표창’ 수상을 비롯해 다양한 기관으로부터 수상을 받는 쾌거를 이뤘다.

20만 명의 회원이 크라우드웍스에서 수집·가공한 데이터 수는 한국어 기초사전 371권 분량에 해당하는 1,856만 건이다. 회원들이 데이터를 가공하며 발생한 일 평균 클릭 수는 약 5.3만 번에 달할 것으로 예측된다.

크라우드웍스에서는 최연소 14세부터 최고령  93세까지 다양한 연령층의 회원이 데이터 라벨링에 참여하고 있다. 연령 뿐 아니라 거주지도 다양하다. 20만 명의 데이터 라벨러는 국내 뿐 아니라 아시아와 유럽 등 전 세계에 분포되어 있는데, 가장 거리가 먼 국가에 사는 회원은 아르헨티나에 거주하고 있는 것으로 나타났다.

크라우드웍스는 불특정 다수가 참여하기 때문에 발생할 수 있는 데이터 퀄리티 문제를 100% 전수 검수로 해결하고 있으며, 이를 통해 데이터 품질을 고도화한다. 이에 데이터 재가공을 요구하는 반려율은 평균 38%로 집계됐으며, 지난 한 해 동안 무려 8천번의 반려를 받은 회원도 있는 것으로 조사됐다. 높은 반려율은 전체 작업속도에 영향을 미칠 수 있기 때문에 크라우드웍스는 자체 개발한 머신러닝(ML) 기술을 활용하여, 불량작업자를 조기에 발견하고 자동으로 작업자를 관리할 수 있는 시스템을 운영하고 있다.

크라우드웍스 박민우 대표는 “2020년은 크라우드웍스가 폭발적으로 성장하며 국내 대표 데이터 라벨링 플랫폼으로써의 입지를 다진 한 해였다”며, “올해는 국내 뿐 아니라 글로벌 AI 시장으로 진출할 발판 마련을 위해 서비스 고도화에 힘쓸 것”이라고 밝혔다.