최신 과학 지식을 접하는
가장 똑똑한 방법!

스타크래프트 2, 인간이 인공지능을 이길까?

2017년 08월 14일 17:00

우주의 원자 갯수만큼이나 많은 경우의 수가 있다는 바둑. 인공지능은 그런 바둑에서 이미 인간을 넘어섰습니다. 이세돌, 커제 등 세계 정상급 기사들이 딥마인드의 바둑 인공지능 (AI) 알파고에 무릎을 꿇었습니다.

 

이미지 확대하기인공지능(AI) 기술의 발전을 확인하기 위해 개발자들은 체스, 바둑, 포커 등 다양한 게임에 도전하고 있다. 사진은 구글 딥마인드가 개발한 바둑 AI ‘알파고’와 대국했던 이세돌 9단 - 동아일보 자료사진 제공
인공지능(AI) 기술의 발전을 확인하기 위해 개발자들은 체스, 바둑, 포커 등 다양한 게임에 도전하고 있다. 사진은 구글 딥마인드가 개발한 바둑 AI ‘알파고’와 대국했던 이세돌 9단 - 동아일보 자료사진 제공

하지만 바둑은 한 번씩 번갈아 가며 수를 두고, 한번에 하나의 돌만 놓을 수 있는 '조용한' 게임입니다. 지금 이 순간 놓는 돌에만 신경 쓰면 됩니다. (물론 돌을 놓을 때 인공지능은 수천 수 앞의 경우를 수를 모두 계산하고 있겠지만요. )

반면 게임, 특히 스타크래프트 같은 복잡한 실시간 전략 게임은 다릅니다. 화면 속 수십, 수백 가지 요소를 동시에 보고 판단을 내려야 합니다. 그래서 인공지능의 다음 도전 대상으로 게임이 관심을 모으고 있습니다.

 

사실 인공지능은 벽돌깨기 같은 단순한 고전 게임은 이미 마스터 했습니다. 딥마인드는 아무런 사전 지도 없이 인공지능이 '벽돌격파' 게임을 배워 2시간 만에 고수처럼 플레이하는 영상을 공개하기도 했습니다. 인공지능은 4시간 만에 벽돌 사이에 터널을 뚫어 공이 천장과 벽돌 사이를 왕복하게 하면 점수를 최대로 높일 수 있다는 사실도 발견했습니다.

 

보다 복잡한 게임에서 인공지능은 어떤 모습을 보일까요? 지난 11일 (현지시각) 미국 시애틀에서 실시간 전략 대전 게임 '도타 2' (DOTA 2) e스포츠 대회인 '인터내셔널 2017'이 열렸는데요, 이 자리에서 미국의 인공지능 연구기관 오픈AI가 만든 인공지능과 세계 정상급 도타 2 프로게이머 대닐 '덴디' 이슈틴의 깜짝 대결이 펼쳐졌습니다.

 

이미지 확대하기The International 홈페이지 제공
The International 홈페이지 제공

3전 2선승제로 치뤄진 이 경기에서 덴디는 첫 경기에서 패한 후 두번째 경기에서도 초반부터 패색이 짙어지자 패배를 인정하고 물러났습니다.

오픈AI의 그록 브렉만 CTO는 경기 후 인터뷰에서 "비록 여러가지 제약이 있긴 하지만, 복잡하고 정리되지 않은 실제 세상의 문제를 배우고 해결할 수 있는 보편적 인공지능 개발에 한발 다가선 것"이라고 말했습니다.

오픈AI는 도타 게임에 대해 따로 학습을 시키거나 사람들의 게임 장면을 보여주지 않고, 그냥 인공지능끼리 서로 대결하며 게임을 익히게 했다고 합니다. 하지만 인공지능은 2주 만에 일대일 대결에서 프로게이머를 이길 정도로 성장헀습니다.

물론 실제 도타 2 게임은 5명이 한 팀이 되어 역시 5명으로 구성된 다른 팀과 5:5로 대결하는 방식이 일반적입니다. 이렇게 참여자가 많아지면 인공지능이 고려해야 할 사항 역시 기하급수적으로 늘어납니다. 여러 명이 팀을 이뤄 게임하는 상황에도 잘 대처할 수 있는 수준으로 인공지능의 실력을 높이는 것이 관건입니다.

 

이미지 확대하기블리자드 제공
블리자드 제공

스타크래프트를 활용한 인공지능 연구도 계속 진행 중입니다.

구글의 인공지능 자회사 딥마인드와 스타크래프트 개발사 블리자드엔터테인먼트는 최근 인공지능 연구자를 위해 스타크래프트 2 게임을 개방한다고 밝혔습니다.

연구자들이 스타크래프트 2 게임에서 벌어지는 일들에 대한 데이터를 얻고 연구를 진행할 수 있도록 돕는 API를 공개한 것입니다. 연구자들이 게임을 보다 잘 이해할 수 있도록 머신러닝 API를 제공하고, 게임 플레이 영상도 익명화해 볼 수 있게 합니다.

또 게임을 유닛 종류나 체력 등의 요소로 분해해 인공지능이 게임 상황을 이해하게 하는 '피처 레이어' (feature layer)를 손쉽게 활용할 수 있는 도구도 제공합니다.

 

이미지 확대하기스타크래프트 유닛 선택에 따라 사람 및 인공지능 플레이어가 선택할 수 있는 행동들 - 딥마인드 제공
스타크래프트 유닛 선택에 따라 사람 및 인공지능 플레이어가 선택할 수 있는 행동들 - 딥마인드 제공

스타크래프트에서 승리하려면 승리라는 목적을 위해 자원 수집이나 기지 건설 등 여러 과제를 각종 제약 속에서 수행해야 합니다. 게임 중 어떤 행동이 실제로 어떤 결과를 가져올 지 예상하기 힘들고, 맵도 부분적으로만 볼 수 있기 때문에 전략 예측이 쉽지 않습니다. 84x84 크리의 작은 화면에서도 1억 가지 행동을 선택할 수 있을 정도입니다.

블리자드가 데이터를 공개하고, 딥마인드가 인공지능 관련 도구를 제공함에 따라 인공지능이 스타크래프트를 배우는 속도도 더 빨라질 것으로 기대됩니다. 조만간 임요환급 인공지능과 대결을 펼치게 될 날이 올지도 모르겠습니다.


한세희 기자

hahn@donga.com

 

메일로 더 많은 기사를 받아보세요!

관련기사

인기기사

댓글

댓글쓰기

관련 태그 뉴스