고성능 그래픽프로세서(GPU)를 위한 3대 기술 개발

2016.06.30 18:00

국내 연구진이 고성능 컴퓨터의 핵심 요소 중 하나인 그래픽프로세서(GPU)의 성능을 획기적으로 향상시켰다.

 

노원우 연세대 전기전자공학부 교수팀은 GPU의 성능을 향상시키는 데 필요한 주요 기술 3가지를 개발했다고 지난달 30일 밝혔다. GPU는 그래픽을 처리하는 장치로 고화질 그래픽은 물론 사물 인식, 자율 주행, 금융 공학 등 많은 양의 데이터를 처리해야 하는 계산 분야에서 폭넓게 활용된다.

  

노원우 연세대 교수팀이 제안한 새로운 구조의 GPU. 가상의 비활성 스레드를 만들어 총 실행 스레드 개수를 늘려 하드웨어 가용성을 높였다. - 연세대 제공
노원우 연세대 교수팀이 제안한 새로운 구조의 GPU. 가상의 비활성 스레드를 만들어 총 실행 스레드 개수를 늘려 하드웨어 가용성을 높였다. - 연세대 제공

연구진은 제한된 하드웨어를 효율적으로 활용해 병렬 처리 능력을 높일 수 있는 ‘가상 스레드’ 기술, 메모리 시스템의 효율을 향상시키기 위한 ‘적응적 프리페칭 및 스케줄링’ 기술, 여러 프로그램을 동시에 수행할 때의 가동률을 높이기 위한 ‘자원공유’ 기술을 개발하고, 각 내용을 담은 논문 3편을 6월 18~22일 서울에서 열린 컴퓨터 구조 분야의 국제적 학술대회인 ‘2016 컴퓨터 구조 국제심포지엄(ISCA)’에서 연달아 발표했다.

 

스레드는 프로그램에서 실제 작업이 수행되는 경로다. 스레드 수가 많을수록 연산 성능이 높다. 하지만  하드웨어의 복잡도 문제 때문에 만들 수 있는 최대 스레드 수는 정해져 있다. 때문에 GPU의 레지스터와 공유 메모리에 여유 공간이 있어도 동시에 실행되는 스레드 수가 일정 수준 이상 늘어날 수 없다. 

 

이에 연구진은 가상 스레드 개념을 도입했다. 공유 메모리의 남은 공간을 활용해 동시에 실행되는 스레드 수를 가상으로 증가시켜 병렬 계산 능력을 높인 것이다. 그 결과 GPU는 기존보다 계산 수행 시간이 23.9%가량 줄어 드는 것으로 확인됐다.

 

필요할 확률이 높은 데이터를 우선적으로 옮기는 등 데이터 병목 현상을 해결할 수 있는 적응적 프리패칭 및 스케줄링 기술을 적용했을 때는 GPU의 성능이 약 31.7%까지 향상됐다. 또 하나의 멀티프로세서를 동시에 여러 프로그램이 나눠서 사용하는 자원공유 기술을 적용했을 때는 약 23% 성능이 향상됐다.

 

노 교수는 “인공지능(AI) 연산에 폭 넓게 활용되는 GPU의 성능을 개선할 수 있는 주요 기술을 개발했다”며 “이를 활용해 고성능 GPU를 국산화할 수 있을 것으로 기대한다”고 말했다.

 

 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150
    * 21대 국회의원 선거운동 기간에는 실명확인 과정을 거쳐야 댓글을 게시하실수 있습니다.
    * 실명 확인 및 실명 등록 서비스는 선거운동기간 (2020. 4. 2 ~ 2020. 4. 14) 동안에만 제공됩니다.