최신 과학 지식을 접하는
가장 똑똑한 방법!

인공지능의 스승은 누구? 첨단 인공지능 뒤에 묵묵히 일하는 사람들 있다

2018년 06월 14일 17:51

바야흐로 인공지능의 시대다. 2016년 바둑 인공지능인 ‘알파고’가 이세돌 9단과의 대국에서 4대 1로 승리하며, 인공지능이 이미 우리 곁에 와 있음을 각인시켰다. 이제 IT 업계는 물론 자동차, 의료, 교육 등 대다수 산업에서 인공지능 활용에 열을 올리고 있다.


이제는 꽤 익숙해진 인공지능이지만, 의외로 우리가 인공지능에 대해 아는 것은 많지 않다. 우리가 일상에서 가장 많이 이용하는 인공지능 중 하나인 검색엔진의 이미지 검색 기능을 예로 들어보자. 고양이 사진을 검생창에 넣으면, 사진 속 고양이와 비슷한 색깔과 무늬의 고양이 사진이 우르르 뜬다. ‘갈색 바탕에 검은 색 점이 있는 고양이’라고 검색할 필요가 없다. 

 

이렇게 사람의 일손을 줄여주는 기특한 인공지능이지만, 이 인공지능이 밥값을 하기까지는 많은 사람의 피와 땀, 눈물이 들어간다. 

 

 

● 인공지능의 스승은 결국 사람, 사진 속 물체 일일이 분류해줘야 학습 가능
 

이미지 확대하기도로 위 다양한 물체들에 이름표를 달아준 모습. 이런 학습데이터가 수만 장 있어야 인공지능이 물체를 학습할 수 있다. - 크라우드웍스 제공
도로 위 다양한 물체들에 '이름표'를 달아준 모습. 이런 학습데이터가 수만 장 있어야 인공지능이 물체를 학습할 수 있다. - 크라우드웍스 제공

최근 태아의 입체 초음파 사진을 입력하면 출산 후 실제 아기 얼굴을 예측해 보여주는 인공지능 서비스가 나왔다. 초음파 사진에 나타난 여러 특징을 바탕으로 실제 얼굴을 예상하는 것이다. 그런데 사진 속 어떤 요소가 어떤 특징을 갖는지 인공지능은 어떻게 배워서 아직 태어나지 않은 아이의 얼굴을 예측하는 걸까? 

 

인공지능은 갓 태어난 아기와 비슷하다. 뇌가 발달해 있지만, 아직 어떤 것이 사람이고, 어떤 것이 자동차인지 알지 못한다. 아기는 세 살까지 수억 개의 이미지를 보고, 부모가 ‘저게 자동차야’라고 수백 번을 알려줘야 비로소 ‘둥그런 바퀴가 네 개 달려있고, 양 옆에 무언가가 튀어나와 있는 네모난 물체’가 자동차임을 인식한다. 

 

인공지능 역시 마찬가지다. 도로를 찍은 사진을 그냥 인공지능에 입력하는 것이 아니라, 자동차, 오토바이, 사람, 유모차 등 사진 속 모든 물체에 ‘이름표’를 달아줘야 한다. 이름표가 달린 사진을 계속 보다 보면 자동차와 사람을 구분할 수 있게 된다. 위의 아기 초음파 사진을 예로 들자면, 초음파 사진을 보고 어디가 눈이고 입인지, 얼굴 윤곽의 주요 부분이 어디인지 등을 표시해 주어 인공지능이 '교보재'로 쓸 수 있어야 한다.

 

이렇게 인공지능이 학습할 수 있는 상태로 정돈된 데이터를 ‘학습데이터’라고 한다. 학습데이터의 질에 따라 인공지능의 학습 능력이나 속도에 차이가 많이 나기 때문에, 최근 학습데이터만을 다루는 기업도 늘어나고 있다. 

 

이미지 확대하기페이페이 리 미국 스탠퍼드대 컴퓨터과학과 교수가 TED 강연을 하고 있는 모습. 리 교수는 2007년 학습데이터를 모으는 이미지넷 프로젝트를 진행했다. - TED 제공
페이페이 리 미국 스탠퍼드대 컴퓨터과학과 교수가 'TED' 강연을 하고 있는 모습. 리 교수는 2007년 학습데이터를 모으는 '이미지넷' 프로젝트를 진행했다. - TED 제공

세계적 전자상거래 사이트 ‘아마존’은 2005년부터 요청자와 작업자를 이어주는 크라우드 소싱 서비스, ‘메커니컬터크(Mechanocal Turk)’를 운영하고 있다. 이 서비스를 인공지능 학습데이터를 만드는 데 처음으로 사용한 것은 페이페이 리 미국 스탠퍼드대 컴퓨터과학과 교수였다. 


리 교수는 인공지능의 알고리즘만큼 알고리즘에 입력하는 학습데이터가 중요하다고 판단해 2007년 수억 장의 이미지 학습데이터를 만드는 ‘이미지넷’ 프로젝트를 시작했다. 프로젝트 연구팀은 인터넷에서 10억 장의 이미지를 내려 받은 뒤, 메커니컬터크를 통해 사진에 이름표를 달아줄 작업자를 구했다. 결국 세계 157개국에서 5만 명에 가까운 작업자가 사진 한 장 당 약 100원의 돈을 받고, 사진을 정리하고 분류하는 작업을 도왔다.

 

 

● 인공지능 발달하며, 학습데이터도 어려워져… 작업자 간 실력 차이도 있어

 

이미지 확대하기2017년 11월에 출시한 네이버의 쇼핑렌즈. 사진을 입력하면 사진 속 의류, 가방 등 패션아이템의 정보를 제공한다. - 네이버 제공
2017년 11월에 출시한 네이버의 쇼핑렌즈. 사진을 입력하면 사진 속 의류, 가방 등 패션아이템의 정보를 제공한다. - 네이버 제공

언뜻 보면 단순한 작업 같지만, 인공지능이 발달하며 학습데이터를 만드는 작업도 꽤 복잡해졌다. 지난해 11월 출시된 네이버 ‘쇼핑렌즈’는 사진을 입력하면 사진 속 사람이 입고 있는 옷, 가방, 신발 등 패션 아이템에 대한 정보를 제공한다. 이런 인공지능을 학습시키려면 다양한 패션 아이템에 대한 정보는 물론, 비슷한 아이템까지 함께 입력한 고품질의 학습데이터가 필요하다. 

 

이미지 확대하기글자인식에 필요한 학습데이터를 분류하는 작업자는 여러 필체의 일본어를 보고 어떤 글자인지를 파악해야 한다. 일정 수준 이상의 일본어 실력을 요구하는 작업이다. - 크라우드웍스 제공
글자인식에 필요한 학습데이터를 분류하는 작업자는 여러 필체의 일본어를 보고 어떤 글자인지를 파악해야 한다. 일정 수준 이상의 일본어 실력을 요구하는 작업이다. - 크라우드웍스 제공

글자인식 서비스 역시 못지않게 까다롭다. 영어나 일본어, 중국어 등이 쓰여진 사진을 입력하면 한국말로 번역해주는 서비스를 떠올려보자. 작업자는 다양한 필체의 일본어 글자가 어떤 글자인지 분류해내야 한다. 고양이와 사람을 분류하는 것만큼 단순한 작업은 아니다. 현재 한국에서 아마존 메커니컬터크와 같은 크라우드 소싱 서비스를 제공하는 크라우드웍스의 박민우 대표는 “이런 작업은 일본어 지식이 있는 작업자만 할 수 있다”며 “인공지능이 복잡해지는 만큼, 필요한 작업자의 역량도 높아진다”고 말했다.


학습데이터 작업의 ‘끝판왕’은 ‘스탠퍼드 퀘스쳔 앤서링 데이터셋(SQuAD, The Stanford Question Answering Dataset, 이하 스탠퍼드 데이터셋)’이라고 부르는 일종의 설문지다. 이는 글의 맥락을 이해하고 사람의 질문에 답을 할 수 있는 인공지능을 학습시키기 위해 미국 스탠퍼드대가 만든 학습데이터이다. 위키피디아 글에 대한 10만 개 이상의 질문과 대답 쌍으로 이뤄져 있다. 가령 공항에 대한 위키피디아 글과 함께 “비행기가 착륙하거나 이륙하는 곳을 무엇이라고 부릅니까?” “공항”과 같은 질문과 답을 제공한다.

 

이미지 확대하기작업자는 기사나 위키피디아 등의 글에서 핵심적인 내용에 대한 질문과 답을 입력해야 한다. 작업자의 능력에 따라 인공지능의 학습 능력이 좌우되기도 한다. - 크라우드웍스 제공
작업자는 기사나 위키피디아 등의 글에서 핵심적인 내용에 대한 질문과 답을 입력해야 한다. 작업자의 능력에 따라 인공지능의 학습 능력이 좌우되기도 한다. - 크라우드웍스 제공

크라우드웍는 우리나라에 적합한 스탠퍼드 데이터셋을 만들고 있다. 박 대표는 “우리가 궁극적으로 개발하고자 하는 인공지능은 사람과 대화가 가능해야 하기 때문에, 최근 스탠퍼드 데이터셋에 대한 수요가 많다”고 말했다. 


가령 “이번 지방선거 결과가 어때”라는 질문을 던졌을 때 지방선거에 대한 검색 결과를 나열하는 것이 아니라, 관련 기사를 읽고 “전체 시도지사 중 더불어민주당 14명, 자유한국당 2명, 무소속 1명입니다”와 같이 대답하는 인공지능이다. 


박 대표는 “작업자는 특정 글에서 핵심을 파악했는지 확인할 수 있는 적절한 질문과 답을 만들어내야 한다”며 “작업자마다 작업 능력이 천차만별이라, 우수한 작업자는 따로 리스트를 만들어놓기도 한다”고 말했다. 결국 사람의 작업 능력이 인공지능의 능력으로 이어지는 셈이다.

 

 

● 인공지능이 새롭게 창출한 일자리, 한 주에 100만 원 이상 벌기도 해

 

이처럼 학습데이터의 품질이 중요해질수록 작업자의 역할도 중요해지고 있다. 인공지능으로 사라지는 일자리가 생기는 만큼, 새로운 일자리가 창출되는 셈이다. 실제 아마존은 세계적으로 50만 명, 또 다른 학습데이터 기업인 ‘크라우드플라워’와 ‘스페어5’는 각각 150만 명, 50만 명의 작업자를 보유하고 있다. 크라우드웍스 역시 우리나라 작업자 3400명이 참여하고 있다. 


이들의 수입은 어떤 작업을 하느냐에 따라 크게 차이 난다. 단순한 사진 분류 작업은 한 장 당 10원도 하지만, 특정 사진의 GPS 값을 입력하는 등 품이 많이 드는 작업의 경우 하나 당 5000원을 받기도 한다. 박 대표는 “작업량이 많으면 일주일에 100만 원 이상 벌고, 7개월 동안 1000만 원 이상을 받은 작업자도 있다”며 “학습데이터에 대한 수요가 많아질수록 작업자의 급여 역시 올라가게 될 것”이라고 말했다.

메일로 더 많은 기사를 받아보세요!

관련기사

인기기사

댓글

댓글쓰기

지금
이기사
관련 태그 뉴스