얼굴 보정, 포토샵 말고 AI에 맡기세요

2019.12.13 07:12
SC-FEGAN으로 사진을 편집한 결과(코, 입, 머리, 액세서리). ETRI 제공.
SC-FEGAN으로 사진을 편집한 결과(코, 입, 머리, 액세서리). ETRI 제공.

사람은 사물의 형태와 특성을 직관적으로 판단해 강아지와 고양이를 구별한다. 사람과 달리 인공지능(AI)이 영상 속 이미지를 분별하고 인식하려면 복잡한 과정이 필요하다. 복잡한 물체의 특징을 찾아내 정보를 추출하고 분석해 정확한 결론을 내릴 수 있어야 하기 때문이다. 이같은 AI 기술은 정지해 있는 사물이나 움직이는 물체를 행동을 빠르게 추적하고 판단해야 하는 자율주행차나 폐쇄회로(CC)TV에 적용되고 있지만 현재는 대부분 외국 기술에 의존하고 있다. 


한국전자통신연구원(ETRI)은 인공지능연구소 시각지능연구실 연구진이 시각 AI 기술의 핵심 알고리즘을 개발했다고 12일 밝혔다. 시각 AI를 학습시키는 데 필요한 도심환경 사물 560종 대상 사물인식 학습 데이터 20만장도 함께 공개한다. ETRI가 공개한 알고리즘과 학습 데이터를 활용하면 원하는 서비스나 새로운 혁신적인 기능을 구현할 수 있어 국내 AI 산업 생태계에 도움이 될 전망이다. 

 

이번에 개발한 시각 AI 알고리즘은 사진 속 물체의 특징을 찾아내 정보를 추출하고 분석하는 AI 기술로 ‘백본 네트워크(VoV Net)’을 통해 공개된다. AI 알고리즘을 개발자들과 쉽게 공유할 수 있는 웹사이트 '깃허브(Github)'에 코드와 사용설명서를 올리는 방식을 말한다.


연구진은 시각 AI 학습에 필요한 높은 품질의 사진 데이터도 함께 공개했다. 데이터에는 도심의 CCTV에 주로 찍히는 전봇대, 신호등, 자동차 등이 포함됐다. 


박종열 ETRI 시각지능연구실장은 “백본 네트워크를 활용하면 사물 검출, 객체 부분별 분할 인식, 안면 인식 등 다양한 기능을 구현할 수 있다”며 “공개한 학습 데이터도 단순히 임의의 사물로 구성된 데이터보다 시각 AI 구현과 학습에 더 효과적일 것”이라고 말했다. 


연구진은 포토샵과 같은 이미지 전문 편집 프로그램을 쓰지 않아도 사람의 얼굴 사진을 쉽고 자연스럽게 편집할 수 있는 AI 기술도 공개했다. 특정 사진을 놓고 사진 속 인물이 하지 않던 액세서리를 추가하거나 머리 모양, 표정까지도 간단한 작업을 통해 AI가 자동으로 편집해 주는 기술이다. 얼굴 사진에 특화한 다양한 편집이 가능한 알고리즘인 셈이다. 


이 기술에는 딥러닝의 일종인 ‘갠(GAN)’ 기술이 활용됐다. 이 기술은 진짜 같은 가짜 데이터를 만들어내는 데 효과적이지만 사용자의 의도나 조건을 완벽하게 반영하지 못한다는 단점이 있었다. 연구진은 이 기술을 보완해 사용자가 원하는 최적의 결과를 낼 수 있도록 했다. 


기술을 활용하려면 인물 사진과 사용자가 원하는 입력값만 알고리즘에 넣으면 된다. 사용자가 원하는 조건에 적합하면서도 해당 사진 속 주변 환경에 자연스럽게 어울리는 이미지를 만들 수 있다.  박 실장은 “국내 시각 AI 기술이 급속도로 성장하고 있지만 외국 의존도가 높은 게 현실”이라며 “이번에 관련 기술을 공개해 국내 산학연이 시각 AI 기반 다양한 산업 생태계를 조성할 수 있도록 적극 지원할 것”이라고 밝혔다. 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150