> 뉴스 > 산업/IT
사람과 인공지능의 협력, ‘㈜딥네츄럴, 레이블러’더 똑똑한 인공지능으로 멋지고 행복한 세상 만들다
신태섭 기자  |  tss79@naver.com
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2021.09.28  17:43:42
트위터 페이스북 미투데이 네이버 구글 msn
   
▲ 딥네츄럴 AI

크라우드소싱 12만명 돌파, 87억원 규모의 데이터 구축

도래하는 4차 산업혁명의 미래, 그 핵심은 산업의 변화에 있어서 단순히 기술이라는 표면적인 변화 뒤에 가려진 ‘지능의 혁명’이다. 여기서 지능은 ‘인간의 지능과 로봇의 인공적인 지능의 융합’을 의미하며, ‘융합된 지능이 어떤 긍정적인 결과로 이어지는가’가 가장 큰 경쟁력이 될 것이다. 얼마 전 출판된 책 ‘메타 도구의 시대’의 저자인 ‘아시아미래연구소’ 최윤식 소장의 의견도 이와 궤를 같이한다. 그는 인공지능의 미래를 두고 ‘자신이 가진 1개의 뇌와 외부에 있는 2개의 뇌를 얼마나 잘 사용하는 지가 중요해질 것이다’고 언급했다. 여기서 외부에 있는 뇌는 서로의 정신이 연결되는 지능인 ‘클라우드 뇌’와 ‘가상세계와 연결되는 인공 뇌’를 말한다. 즉 인간의 뇌와 인간이 만들어 낸 인공 뇌의 융합의 중요성에 대해 강조하는 것이다.
세계 전문가들은 미래를 주도해나갈 핵심분야로 가장 먼저 인공지능(AI)을 꼽는다. 우리나라에서도 AI와 빅데이터로 대변되는 4차 산업을 주요 미래 먹거리 산업으로 키워나가기 위해 많은 노력을 기울이고 있다. 이런 가운데 인공지능과 사람의 지능의 융합으로 우리나라 AI 경쟁력을 한층 더 끌어올리고 있는 인공지능 데이터 가공 전문기업 ‘딥네츄럴(대표 박상원, 박정수)’이 관련 업계에서 많은 주목을 받고 있다.

인공지능의 정확도는 데이터 가공이 가장 중요, 엄청난 시간과 노력 필요한 작업
2020년 인공지능(AI)에 관한 정부 예산이 2019년에 비해 150% 증가했다. 여기에 과학기술정보통신부(이하 과기정통부)는 작년 하반기에 한국판 뉴딜계획 중 디지털뉴딜의 중심축인 데이터/인공지능/클라우드 분야에 7개의 추경 사업을 추가로 진행했다. 장기적 계획은 이 분야에 2025년까지 국비 44조 8000억 원을 투자한다는 계획이다. 그야말로 세계는 물론 우리나라도 인공지능 기술에 미래 국가경쟁력의 사활을 걸고 있는 셈이다.
인공지능은 똑똑하다. 그리고 그 이면에서 똑똑함을 만들어내기 위해서 사람의 엄청난 노력이 투입된다. 그중에서도 인공지능의 정확도를 가늠하는 가장 중요한 작업이 데이터 가공이다. 데이터 라벨링이라고도 불리는 이 과정은 이른바 ‘데이터 눈깔 붙이기’라는 우스갯소리가 나올 정도로 엄청난 시간과 노력이 동반되는 수작업을 통해 완성된다.
딥네츄럴은 이러한 수작업 과정에 인공지능의 능력을 더해서 보다 효율적인 작업을 함과 동시에 품질 높은 데이터를 공급하고 있다. AI 기술이 기업의 경쟁력이 되는 현대 사회에서 많은 기업들이 인공지능의 완성도를 높이기 위한 초석과 같은 ‘고품질 학습 데이터’를 확보하기 위해 혈안이 되어 있는 가운데, 딥네츄럴에서 제공하는 수준 높은 양질의 데이터가 자연스럽게 많은 주목을 받고 있다.

딥네츄럴의 특별한 인공지능, ‘프라이데이’
크라우드소싱 레이블러들의 레이블링 작업과 검수 효율성을 높이다

일반적으로 AI를 만드는 과정을 살펴보면 작업에 필요한 가장 기본 자료인 이미지나 텍스트, 음성 등의 원천 데이터가 필요하다. AI 개발자들이 원천 데이터를 보유하고 있기도 하지만, 크라우드소싱을 통해 수많은 사람들로부터 다양한 데이터를 수집하기도 한다. 딥네츄럴에서 원천 데이터는 일반인들도 가능한 쉽게 라벨링 할 수 있는 ‘마이크로 태스크’로 변환되어 자사의 크라우드소싱 플랫폼 ‘레이블러(https://www.labelr.io)’에 등록된다. 작업자는 작은 태스크 단위로 데이터를 보거나 읽고, 들으면서 인공지능이 학습할 수 있는 정보를 레이블링 한다. 머신러닝 기반의 인공지능이 학습 할 수 있는 형태로 정답 데이터를 만드는 것이다. 그리고 다시 전문 인력으로 구성된 검수팀에서 작업자들이 제출한 데이터를 하나씩 꼼꼼히 확인하는 과정을 거친다. 인공지능에게 정답을 학습시켜야 하기 때문에 99.9%의 정확성이 확보 되어야 한다. 이렇게 검수를 마친 고품질 학습 데이터는 인공지능이 학습 할 수 있는 형태로 한번 더 포맷이 변환되고, 인공지능에 입력된다. 쉽게 말해서 ‘이미지가 동물인지 물건인지, 또한 텍스트나 음성이 무슨 의미를 담고 있는지’ 정답을 적어서 인공지능에 주입시키는 것이다. 하나의 인공지능을 개발하기 위해서 적게는 수천건에서 많게는 수백만건 이상의 데이터 가공이 필요하다.
현재 인공지능의 핵심 기술은 머신러닝, 딥러닝이다. 명확한 논리를 쌓아나가는 전통적인 소프트웨어 개발과 다르게, 머신러닝 기반 인공지능 소프트웨어 개발은 인공신경망과 같은 모델을 설계하고 정교하게 만들어진 데이터를 주입하여 패턴을 인식하도록 학습시키는 방식이다. 그래서 충분히 많은 양의 고품질 데이터가 있어야 더 똑똑한 인공지능이 만들어질 수 있다. 이러한 복잡한 데이터 준비 과정을 데이터 구축이라고 하는데, 딥네츄럴의 인공지능 학습용 데이터 구축에는 인간의 수작업을 돕는 특별한 인공지능 ‘프라이데이’가 있다. ‘프라이데이’는 인공지능을 위한 학습 데이터 구축 과정을 돕는 딥네츄럴의 인공지능이다. 딥네츄럴에서 독자적으로 개발한 ‘프라이데이’는 크라우드소싱 레이블러들의 레이블링 작업과 검수 효율성을 높이고 있다.

결과물의 정확도와 신속성을 높이고, 작업 비용은 절약
사람과 인공지능의 협력으로 인공지능의 발전을 더욱 가속화하다

AI 기술이 사람 수준의 지능을 갖는 것은 먼 미래의 이야기다. 하지만 좁은 영역에 맞춰 한정적인 목표를 성취하는 AI 기술은 이미 상당히 높은 수준으로 발전했다. 프라이데이 역시 여러 데이터 구축 유형에 맞추어 각각의 좁은 목표들을 달성하는 인공지능이다. 레이블링이 필요한 수만 건의 데이터 중 일부 데이터를 전문 인력이 우선 작업 및 검수하여 시드 데이터를 만들고, 딥러닝 기반 프라이데이가 이를 학습한다. 그리고 다음 일부 데이터에 대해서 프라이데이가 오토 레이블링하고, 사람이 다시 검수 및 보완하는 과정을 반복한다. 데이터 구축 프로젝트가 진행되며 후반부로 갈수록 프라이데이는 점점 더 똑똑해져서 사람의 수작업 양은 줄어들게 된다. 또한, 크라우드워커들이 제출한 수백만건의 데이터를 검수자들이 직접 확인해야 하는데, 가이드라인에 확연히 벗어난 작업들을 프라이데이가 자동으로 필터링하여 걸러준다. 사람들의 수고를 덜어주게 되고 시간적 효율성을 높인다. 전문성을 갖춘 검수자들이 100% 검수를 진행하지만, 인공지능 프라이데이가 봤을 때 명확히 부정확한 데이터는 사람 대신 반려하여 재작업 하도록 한다. 이를 통해 더 많은 양질의 데이터를 구축할 수 있다. 결국 더욱 정확도 높은 결과물을 얻어낼 수 있고, 작업 비용은 오히려 더욱 절약하는 효과로 나타나고 있다. 이런 프라이데이가 점점 영역을 넓히고 발전할수록 딥네츄럴의 경쟁력도 함께 올라가고 있다. 딥네츄럴 박상원 대표는 “당사는 크라우드소싱과 오토 레이블링 및 오토리뷰를 결합한, 사람과 인공지능의 협력적 데이터 구축 프로세스를 국내 최초로 자체 개발해서 인공지능 학습 데이터 구축 생산성을 높이고 있다. 사람과 인공지능의 협력으로 인공지능의 발전을 더욱 가속화하고 있는 것이다”고 언급했다.

언어데이터 구축에 강점, 기업/연구소/정부기관의 77건의 프로젝트 성공적으로 수행
딥네츄럴은 인공지능 중에서도 난이도가 매우 높은 자연어 이해 및 처리 분야에 특별한 강점을 가지고 있다. 기계가 사람처럼 대화하고 언어를 이해할 수 있는 기술에 필요한 텍스트, 이미지, 오디오, 비디오 학습 데이터를 전문적으로 구축한다. 카이스트와 TU 베를린에서 기계학습 기반 자연어처리를 공부한 박상원 대표는 본인이 보유한 기술에 대한 이해력과 지식을 십분발휘하여, 다양한 언어데이터 프로젝트에서 우수한 성과를 보이면서 높은 경쟁력을 인정받았다. ‘KB금융지주 말뭉치구축 프로젝트’를 비롯해서 여러 기업의 데이터 구축사업에 참여하여 우수한 결과물을 제공했으며, 데이터 바우처, AI 바우처, 한국지능정보사회진흥원(NIA) 학습용 데이터 구축사업 등 정부의 데이터 댐 사업에서 다양한 성과를 냈다. 지금까지 총 77건, 약 87억원 규모의 데이터 구축 프로젝트를 성공적으로 완료 및 진행 중이다.
이와 같은 전문성과 경쟁력을 바탕으로 딥네츄럴은 3년 연속 데이터 한국데이터산업진흥원(K-DATA)이 주관하는 ‘데이터 바우처 지원사업’의 공급기업으로 선정됐다. 딥네츄럴의 경쟁력을 눈여겨본 본엔젤스로부터 2019년 5억원 초기 투자를 받고, 민간주도형 기술창업지원 TIPS 사업을 통해 5억원을 추가로 지원 받았다. 현재는 시리즈A 투자 유치를 준비 중이다. 여러 성과와 투자 유치에 힘입어 2019년 10명이던 임직원수는 현재 66명까지 늘었다.

누구나 참여가 가능한 크라우드소싱 플랫폼 ‘레이블러’, 최고의 재테크로 자리잡다
미래의 국가경쟁력은 인공지능 기술, 국가경쟁력 제고를 위한 최고의 파트너 될 것

데이터 구축 프로젝트에서 약 80%의 시간이 학습데이터 마련에 사용된다. 충분히 많은 양의 데이터를 최대한 빠르고 효율적으로 목표 이상의 품질로 얻어내는 것이 데이터 가공 프로젝트의 가장 큰 쟁점이다. 딥네츄럴은 PC와 모바일에서 참여가 가능한 크라우드소싱 플랫폼 ‘레이블러’를 출시해 제약 없이 누구나 간편하게 데이터 가공에 참여할 수 있는 환경을 구축했다. 현재 레이블러를 통해 크라우드소싱에 참여한 작업자가 12만 명을 넘어섰으며, 이들이 제출한 데이터가 총 700만 건, 그리고 작업자들이 총 22억 원의 소득을 올렸다. 많은 유튜버와 인플루언서들이 레이블러를 집에서 할 수 있는 가장 좋은 재테크로 소개하며, 더욱 많은 작업자들이 이곳의 크라우드소싱 플랫폼을 찾고 있다. PC나 모바일에서 플랫폼을 다운로드 받은 후 나이와 성별, 거주지역 등 간단한 설문 조사에 응하고 간단한 심사를 통과하면 누구나 작업자가 되어 수익을 창출할 수 있다.
박상원 대표는 마지막으로 “언젠가 될지는 모르지만 언젠가는 영화 아이언맨의 ‘자비스’와 같은 인공지능이 나올 것 같다. 아직은 먼 미래의 이야기지만 그 전에는 사람 수준의 인공지능이 나올 것이라고 생각한다. 결국 인공지능을 만드는 능력이 기업, 연구소, 그리고 국가 전체의 경쟁력이 될 것이다. 당사는 계속해서 인공지능 연구자들의 파트너가 되어 필요한 고품질 데이터를 보다 빠르게 공급하고자 한다. 인공지능 산업 전반에 걸쳐, 그리고 국가경쟁력에 도움이 되는 기업이 되고자 한다”고 언급했다.  

신태섭 기자의 다른기사 보기  
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 네이버 구글 msn 뒤로가기 위로가기
가장 많이 본 뉴스
신문사소개기사제보광고문의불편신고개인정보취급방침청소년보호정책이메일무단수집거부
㈜뉴스앤매거진 파워코리아 대표 백종원  |  서울특별시 광진구 중곡동 162-3번지 2층  |  대표전화 : 02-466-5085  |  팩스 : 02-444-0454
대표메일/제휴광고문의 : bridgekorea@naver.com  |  개인정보관리책임자 : 백종원(bridgekorea@naver.com)  |  사업자등록번호 : 591-87-01957
청소년보호책임자 : 백종원
월간 파워코리아의 기사는 회사, 기관, 개인 등으로부터 제공받은 자료 및 인터뷰를 토대로 작성되며,
기사에 소개된 제품이나 서비스 내용을 보증하지는 않습니다.
Copyright © 2022 월간파워코리아. All rights reserved.