“네이버 검색엔진 수준, 구글에 안 뒤진다”

2016.03.25 11:00

우리는 흔히 생각한다. 검색 시장에서 네이버의 성공 비결은 데이터를 잘 만들어 가공했기 때문이라고… 그래서 네이버는 ‘검색엔진’이 아니라 ‘편집엔진’이라는 비아냥을 받기도 한다.

 

이런 비판을 받는 결정적 이유는 ‘웹검색’에서 약점을 보이기 때문이다. 네이버의 자체 DB에 쌓인 지식iN, 카페, 블로그 등은 잘 검색하지만, 네이버 외부에 있는 웹문서는구글에 비해 제대로 보여주지 못한다는 것이 일반적 평가다.

 

이런 인식에 대해 네이버의 검색엔진 개발자는 어떻게 생각을 하고 있을까? 네이버 검색엔진 개발자라면 국내 최고의 검색 전문가 중 한 명일텐데, 구글에 비해 못하다는 평가를 어떻게 받아들일까?

 

곽용재 네이버 검색시스템 센터장
곽용재 네이버 검색시스템 센터장

이런 궁금증을 가지고 네이버 곽용재 검색시스템센터장을 만났다.

 

네이버 검색은 Δ검색시스템과 Δ검색모델링이라는 크게 두 분야로 구분한다. 검색 시스템은 크롤링, 색인, 속도, 검색 알고리즘 등 검색을 위한 기본 엔진을 담당하고, 검색모델링은 검색엔진에서 나온 결과를 바탕으로 랭킹을 정하거나 구체적인 서비스로 만드는 일을 담당한다. 곽 센터장은 네이버에서 검색시스템을 이끌고 있다.

 

곽 센터장은 네이버의 검색엔진 수준이 구글에 미치지 못한다는 의견에 대해 “전혀 동의하지 않는다”고 일갈했다.

 

그는 “엔지니어링 측면에서 네이버의 검색엔진은 구글에 뒤지지 않는다고 자신한다”면서 “네이버가 색인하고 있는 문서만 수백 억 건인데, 통합 검색을 하면 1초 안에 이들 문서에서 적합한 결과를 찾아서 보여준다”고 말했다.

 

그는 “현재의 네이버 검색엔진을 가지고 구글 스케일의 서비스를 만든다고 해도 충분히 가능하다”면서 “지금 기술 수준으로 글로벌에 나가기에 부족하지 않다”고 강조했다.

 

그렇다면 왜 네이버는 검색 기술로 인상적인 느낌을 주지 못하고 있을까?

 

이에 대해 곽 센터장은 “검색엔진 기술이 부족해서라기 보다는 서비스 정책으로 인한 것으로 보인다”면서 “인터넷 초기에 한국어 웹문서가 별로 없어서 자체적으로 문서를 만들어 보여주는 것에 중점을 둬왔고, 한국에 특화된 서비스를 만들다보니 기술이 부각되지 않았다”고 설명했다.

 

그는 이어 “현재 네이버 기술력에 대한 선입견은 이런 서비스 정책으로 인해 이전에 고착화 된 것”이라며 아쉬워했다.

 

곽 센터장의 자신감에도 불구하고, 나를 비롯해 많은 사람들이 네이버의 웹검색에 그렇게 높은 점수를 주지는 못할 것 같다. 일단 네이버 웹검색에 <바이라인 네트워크> 기사가 잘 안 걸린다고 느낀다.

 

이에 대해 곽 센터장은 “이 역시 정책으로 인한 것이지, (기술력이 없어서) 웹문서를 수집하지 못하는 건 아니다”라고 강변했다.

 

그는 “네이버는 웹검색에서 모든 문서를 다 검색해 보여주는 정책이 아니라 좋은 문서를 선별해서 보여준다는 정책을 가지고 있다”면서 “(바이라인 네트워크도) 좀더 활성화 되면 검색 될 것”이라고 덧붙였다.

 

이렇게 자신감이 넘치는데 그 동안 세간의 박한 평가가 억울하지는 않았을까?

 

곽 센터장은 “그런 얘기는 13년 전부터 들어왔는데, 회사가 (기술력을 자랑하는 것에) 부끄럼움을 좀 타서 서비스를 주로 부각해 왔다”면서 “그렇다고 해서 기술력이 부족한 것은 전혀 아니다”라고 말했다.

 

그는 각광받는 오픈소스 기반의 검색엔진인 엘라스틱 서치와 비교해서 설명했다.

 

그는 “만약 엘라스틱 서치로 저희 서비스 만들려면, 지금보다 10배 이상의 비용을 들여야 할 것”이라면서 “인프라를 최소화 하면서 서비스에 필요한 기술을 제공하는 것이 기술력”이라고 강조했다.

 

사실 현재 네이버의 통합검색의 구조 내에서 웹검색은 큰 가치를 발휘하지 못한다. 네이버는 뉴스, 블로그, 카페, 지식iN, 웹문서 등 컬랙션 별로 구분해서 검색결과를 보여주는데, 일반적으로 웹문서 컬랙션은 높은 랭킹을 차지하지 못하는 경우가 많다.

 

하지만 모바일에서는 다르다. 모바일 기기의 한정된 화면으로 인해  컬랙션 별로 검색결과를 보여주지 않는다. 결국 구글처럼 모든 컬랙션의 콘텐츠가 서로 랭킹 경쟁을 하게 된다. 이런 상황에서 웹문서도 블로그나 카페, 지식iN처럼 잘 검색될까. 지켜볼 필요가 있겠다.

 

 

※ 필자소개

심재석. IT 전문 기자. 전문 기자들의 멀티채널네트워크, ‘바이라인 네트워크’의 대표. 인터넷의 발달로 정보 소모가 빠른 현대에도 독자에게 정확하고 깊이 있는 기사를 전달하는 것이 기자의 의무이자 자부심이라는 생각으로 글을 쓰고 있다.

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150