[알파고 1승]알파고, 셀프대국 통해 학습능력 키워… 5개월새 놀라운 진화

2016.03.10 07:00

 

8일 오후 이세돌 9단이 알파고와의 경기를 시작하고 있다 - 한국기원제공 제공
8일 오후 이세돌 9단이 알파고와의 경기를 시작하고 있다. - 한국기원 제공

 

세기의 바둑 대결에서 알파고의 연산 능력이 이세돌 9단의 바둑 감각을 이겼다. 대국을 지켜본 인공지능(AI) 전문가들은 “알파고가 냉철한 대응과 차분한 수읽기에서 강점을 보였다”고 분석했다.


바둑은 돌을 놓을 수 있는 경우의 수가 최대 250의 150제곱에 달한다. 지구를 포함한 우주의 모든 원자 수(약 10의 80제곱)를 합친 것보다도 월등히 많다. 이 때문에 바둑에서 모든 수를 계산하는 건 이론적으로 불가능하다. 프로 기사는 경험에 의한 직관과 통찰력으로 다음 수를 어느 정도 예측한 뒤 여기에 맞춰 돌을 놓을 수밖에 없다.


하지만 알파고는 최고 성능 슈퍼컴퓨터급 자원을 총동원했다. 빠른 계산에 최적화된 행렬 연산을 위해 그래픽연산장치(GPU) 500~600장을 투입했다. 그래픽연산장치 한 장은 개인용 컴퓨터에 들어가는 중앙처리장치(CPU)보다 최소 8배 이상 빨리 계산해낸다.

 

결국 알파고는 바둑 한 수를 두기 위해 최고급 컴퓨터 4000~5000대를 한꺼번에 동원한 셈이다. 더구나 이런 장비를 모두 100Gbps급의 초고속 네트워크로 연결했다. 컴퓨터끼리 정보를 주고받을 때 걸리는 시간을 최소화한 것이다.


알파고는 이 9단에 밀리지 않고 종반 이후 꾸준히 리드를 이어갔다. 김성호 한국과학기술정보연구원(KISTI) 슈퍼컴퓨터개발센터장은 “알파고는 국내 연구용 슈퍼컴퓨터 ‘타키온’ 연산 속도의 5, 6배에 이른다”며 “이렇게 고급 자원을 이세돌 한 사람을 꺾기 위해 투입한 것이 놀랍다”고 덧붙였다.

 

‘딥러닝’의 힘도 돋보였다. 알파고의 기본 시스템은 컴퓨터 바둑 프로그램이 주로 사용하는 ‘몬테카를로 트리 탐색(MCTS)’이다. 이는 돌을 놓은 자리에서부터 새롭게 연산을 수행해 다음 수를 계산하는 방식이다. 무한대에 가까운 연산 범위를 현실적인 선에서 줄일 수 있다. 알파고 개발자들은 여기에 컴퓨터 스스로 학습할 수 있는 ‘딥러닝’ 기법을 덧붙였다.


손영성 한국전자통신연구원(ETRI) 스마트홈팩토리연구실 책임연구원은 “기본 알고리즘을 바꾸지 않고 단기간에 실력을 올리는 방법은 딥러닝 강화밖에 없다”고 말했다.

 

이번 대국으로 알파고가 이 9단과 맞붙은 경험이 축적된 만큼 앞으로 알파고에 더 유리할 수 있다는 전망에 대해 손 연구원은 “딥러닝은 학습량이 많을수록 유리하다. 이 9단의 기보를 한 차례 학습한 경험이 큰 의미가 있는 것은 아니다”고 말했다.

 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150