인간의 데이터로 스스로 진화하는 머신러닝

2015년 05월 28일 17:59

“너 몇 살이니?”

 

이제 이런 물음을 던지면 ‘옛날사람’ 취급받는 시대가 오고 있습니다. 최근 인터넷에서는 사람의 얼굴을 인식하고 나이를 맞히는 사이트 '하우올드닷넷'이 화제를 모았어요. 이 서비스는 5월 초 미국 샌프란시스코에서 열린 마이크로소프트 개발자 회의 ‘빌드2015’에서 처음 공개됐죠.

 

사진을 올리면 얼굴의 나이와 성별을 맞히는 하우올드닷넷 사이트 - how-old.net 제공
사진을 올리면 얼굴의 나이와 성별을 맞히는 하우올드닷넷 사이트 - how-old.net 제공

이 사이트에 사진을 올리면 수초 안에 안면인식을 통해 나이와 성별을 추정한 결과를 알려줍니다. 때로는 터무니없는 나이를 말해주기도 하지만, 더 많은 데이터를 통해 ‘학습’해 갈수록 점점 정확도가 높아집니다. 아직은 기대보다 덜 만족스럽겠만 이러한 서비스가 시작됐다는 건 ‘머신러닝(machine-learning)’이라는 서비스가 가져올 변화의 예고편입니다.

 


◇ 무엇을 사고 무엇을 할지 예측하다 

 

비슷한 구매패턴을 가진 사람들이 선호한 책들을 추천해주는 서비스 - 알라딘 제공
비슷한 구매패턴을 가진 사람들이 선호한 책들을 추천해주는 서비스 - 알라딘 제공

‘머신러닝’이란 말은 아직 우리에게 생소하지만, 실은 그리 멀리 있는 기술이 아닙니다. 이미 우리 일상의 다양한 분야에 녹아들어 있는데요. 가령 쇼핑몰을 이용할 때 나와 비슷한 구매패턴을 가진 사람들이 선호한 상품을 찾아 추천해주는 것이 머신러닝의 한 예입니다.

 

한 엘리베이터 회사는 머신러닝 기술을 도입해 모터의 상태와 운행 속도 등 각종 정보를 분석하고 고장을 예측함으로써 안전도를 대폭 높였다고 합니다. 컴퓨터, 스마트폰, 각종 단말기에서 생성되는 엄청난 양의 데이터…. 이 데이터를 활용해 뉴스, 일기예보, 안전, 교통, 항공, 쇼핑, 금융, 음악, 영화 등 모든 분야에서 앞으로 무엇을 사고, 보고, 듣고, 무엇에 관심을 가질지 예측하는 것입니다.

 


◇ ‘데이터 반, 학습 반’ 머신러닝

 

pixabay.com 제공
pixabay.com 제공

머신러닝 하면 따라오는 키워드로 빅데이터, 인공지능, 딥러닝이 있습니다. 인공지능이 기계로 하여금 인간과 같은 사고나 행동을 하도록 만드는 것이죠. 그 방법 중 하나인 머신러닝은 주어진 데이터를 활용해 일정한 패턴을 파악하고 스스로 학습하며 성능을 향상시키는 기술입니다. 딥러닝은 머신러닝에서 좀 더 세분화된 단계인데요. 사물을 인식하고 처리하는 신경망 형태의 구조를 만들어갑니다.

 

여기에서 중요한 건 미래를 ‘예측’한다는 점입니다. 학습된 기계는 과거의 데이터를 분석하는 데 그치는 게 아니라 미래를 예측할 수 있습니다. 데이터에 숨겨진 속성을 발견해 스스로 추측하고 앞을 내다볼 수 있게 해주는 것이죠. 데이터가 풍부할수록 예측은 더욱 정교해지는데요. 대형 IT 기업들이 문자 인식, 이미지 인식, 연관 검색어 처리 등의 분야에서 앞다퉈 서비스를 개발하는 이유는 방대한 데이터를 수집하고 보유할 수 있기 때문입니다.


 

◇ 이미지 인식 기술 사람의 인식율에 가까워

 

구글과 앤드류 응 박사는 이 그림처럼 이미지를 패턴화해 사물을 인지하는 방식으로 유튜브에서 고양이를 찾아내는 데 성공했다. - 미국 스탠퍼드대 제공
구글과 앤드류 응 박사는 이 그림처럼 이미지를 패턴화해 사물을 인지하는 방식으로 유튜브에서 고양이를 찾아내는 데 성공했다. - 미국 스탠퍼드대 제공

구글의 경우 일명 ‘고양이’ 인식 기술로 화제를 모았습니다. 구글은 2012년 앤드류 응(Andrew Ng) 박사와 손잡고 1만 6000개의 컴퓨터 프로세서, 10억 개 이상의 DNN(심층신경네트워크)를 구현해 유투브에서 고양이를 인식하는 실험을 했는데요. 사람들이 ‘고양이’라는 단어를 표현한 것을 통해 찾아낸 게 아니라, 이미지 자체를 분석해 고양이를 찾아내는 기술이었습니다. 마치 사람이 고양이 이미지를 보고 한 눈에 인지하는 방식처럼, 기계 또한 이미지의 패턴을 읽고 찾아내는 방식을 스스로 해낸 것입니다.
 
페이스북도 지난해 사람의 얼굴을 97.25%의 정확도로 알아내는 ‘딥 페이스’란 인공지능 기술을 개발했습니다. 컴퓨터가 스스로 얼굴 특징을 분석한 뒤 동일인이 다른 장소 다른 각도로 찍은 사진을 가려내는 기술이죠. 인간의 인식률인 97.53%에 버금가는 수준이라니 놀라운 결과입니다.

 

 

◇ 체스 게임에서 챔피언 꺾은 왓슨의 최근 행보

 

2011년 미국의 유명 TV 퀴즈쇼 ‘제퍼디’에서 우승한 전력을 보유한 왓슨. 최근 백혈병 진료에서 진화된 머신러닝 기술을 선보였다. - 동아일보DB 제공
2011년 미국의 유명 TV 퀴즈쇼 ‘제퍼디’에서 우승한 전력을 보유한 왓슨. 최근 백혈병 진료에서 진화된 머신러닝 기술을 선보였다. - 동아일보DB 제공

이처럼 2000년대 이후 이미지 인식과 음성 인식 분야에서 머신러닝이 큰 성과를 나타내고 있는데요. 또 다른 곳에서 활약하는 머신러닝 기술이 있습니다. 왓슨이라고, 퀴즈쇼에서 인간 챔피언들을 제압한 슈퍼컴퓨터입니다.

 

왓슨은 현재 의료와 과학, 금융, 범죄 해결에까지 활용 분야를 넓히고 있는데요. 왓슨은 지난해 6월 미국 임상종양학회에서 200명의 백혈병 환자를 대상으로 치료법을 제시했는데 그 정확도가 82.6%에 달했습니다. 2013년 10월부터 미 MD앤더슨 암센터에서 머신러닝을 통해 백혈병 환자 진료에 관한 지식을 학습해 얻은 결과였죠. 하루가 다르게 스스로 지식을 습득하고 생각하는 힘을 기르고 있기에 가능한 일입니다. 


 

◇ 뽀로로 대사도 맞힌다  

 

이 기계에 뽀로로 애니메이션의 특정 장면을 보여주자 스스로 자막으로 설명하고 이와 관련된 새로운 이미지도 찾아냈다.  - 서울대 컴퓨터공학과 제공
이 기계에 뽀로로 애니메이션의 특정 장면을 보여주자 스스로 자막으로 설명하고 이와 관련된 새로운 이미지도 찾아냈다.  - 서울대 컴퓨터공학과 제공

국내에서도 다양한 머신러닝 기술을 연구하고 있는데 최근 흥미로운 기술이 탄생해 눈길을 끕니다. 아이들이 좋아하는 뽀로로 애니메이션을 보고 대사를 맞히는 기술인데요. 서울대 컴퓨터공학과 장병탁 교수팀이 뽀로로 애니메이션을 보고 그림과 언어가 결합된 개념을 형성하고 스스로 학습하는 인공지능 기술을 선보였습니다. 이 기계에 뽀로로 애니메이션 183개 에피소드(총 1232분 분량)의 이미지와 영어 자막을 집어넣자, 스스로 이미지와 자막 간의 관계, 시간적 흐름을 학습하는 결과를 나타냈습니다.

 

특정 이미지를 보여주니 적당한 자막을 만들어냈고, 등장인물의 이름과 단어를 포함한 대사를 입력하니 이에 적합한 이미지도 표시했어요. 이 기계의 목적은 인간 학습자와 상호작용 하면서 가르치는 개인교사 역할을 하는 것입니다. 연구팀에 따르면 이 프로그램은 피교육자, 즉 아이들의 행동도 패턴화하며 학습할 수 있어 교육효과가 더 높아질 거라고 합니다. 스스로 학습하는 머신러닝을 활용한 교육 도구인 셈이죠.

 


◇ 머신러닝의 미래 어디까지일까?

 

머신러닝에 기반한 인공지능의 미래를 궁금하게 만드는 영화 ‘엑스 마키나’의 한 장면 - 유니버설픽쳐스인터내셔널코리아 제공
머신러닝에 기반한 인공지능의 미래를 궁금하게 만드는 영화 ‘엑스 마키나’의 한 장면 - 유니버설픽쳐스인터내셔널코리아 제공

최근 엑스마키나, 채피 등 인공지능 기술을 주제로 한 SF영화가 인기를 얻고 있습니다. 엑스마키나란 ‘데우스 엑스마키나’ 즉, 기계로 내려온 신이라는 극적 장치를 뜻합니다. 고대 연극에서 주인공이 위기를 맞다가 갑자기 등장한 외부의 힘(기계장치)에 의해 탈출하는 식이죠. 신의 존재가 유일무이했던 과거에는 그러한 전개가 가능했지만, 과학문명이 발전한 지금은 신이 아닌 인간의 힘에 의해서만 새로운 스토리를 맞이할 수 있을 것입니다.

 

스스로 학습하는 기계에게도 아직까지는 사람의 손길이 더욱 필요합니다. 프로그래밍에서부터 통계학, 수학, 데이터 과학 등 인간의 개입이 더해질수록 기계의 학습효과도 커지기 때문이죠. 빅데이터와 클라우드 컴퓨팅 등 정보통신 환경의 진보로 머신러닝이 가져올 미래를 예측해보는 즐거움도 우리의 몫이네요.

 


이종림 객원기자

lumen002@naver.com

태그

메일로 더 많은 기사를 받아보세요!

관련기사

인기기사

댓글

댓글쓰기

지금
이기사
관련 태그 뉴스