한국지식재산연구원은 한국지능정보화사회진흥원이 추진하는 ‘2021년 인공지능(AI) 학습용 데이터 구축 사업(2차)’에 주관 기관으로 선정됐다.
한국지식재산연구원은 ㈜마크클라우드, ㈜아이웹, 광운대(이석준 교수 연구팀) 및 국내 유수 특허 법인 4곳(특허법인 로얄, 해율특허법률사무소, 특허법인KBK, 지심특허법률사무소)과 컨소시엄을 구성해 ‘산업정보 연계 주요국 특허 영-한 데이터 구축’ 사업을 진행한다.
동 컨소시엄은 지난해 ‘상표 이미지 및 상표 텍스트 AI 데이터 구축’ 사업의 참여 기관들로 구성되어, 우수한 사업 성과를 바탕으로 2년 연속 지식 재산 분야 AI데이터 구축 사업에 선정되었다. 이번 사업은 총 20억원 규모로, 연말까지 미국·유럽·일본·중국에 등록된 특허 명세서 총 40만 건을 영-한 번역하고, 산업 분류, 기술 용어 정보가 포함된 AI 학습 용 데이터 셋을 구축할 예정이다.
본 사업은 디지털 뉴딜 ‘데이터 댐’의 핵심인 AI 데이터 구축·개방을 통해 대국민 AI 서비스의 발전과 대규모 일자리 창출을 목적으로 한다. 이에, 동 컨소시엄은 연말까지 AI 학습용 데이터의 정제·가공, 검증 등을 위해 18명을 신규로 고용하고, 특허 번역 분야의 경력단절 여성 및 청년 등 100명의 크라우드 워커를 채용할 계획이다.
‘데이터 댐’은 정부가 2020년 7월 14일 발표한 ‘한국판 뉴딜’ 정책의 10대 과제 중 하나로, 데이터 수집·가공·거래·활용기반을 강화하여 데이터 경제를 가속화하고 이를 위해 공공 데이터 14만 2,000개 신속 개방, AI 학습용 데이터 1,300종 구축 등을 추진하고 있다.
총괄책임자인 한국지식재산연구원 임효정 박사는 “이번 AI 학습용 데이터의 핵심은 ‘사람에 의한’ 정확한 특허문헌의 번역을 통해 주요국 특허에 500개의 산업분류를 부여하는 것”이라며, “한국지식재산연구원이 개발한 특허기술분류(IPC)-한국표준산업분류(KSIC)간 연계확률표를 활용하여 특허문헌의 산업분류를 가이드함으로써 구축 데이터의 품질을 담보할 수 있을 것으로 기대한다”고 밝혔다.
관련기사더보기