인공지능 기술로 효소 기능 정확히 예측한다

2019.07.02 16:17
이상엽 특훈교수. KAIST 제공.
이상엽 특훈교수. KAIST 제공.

인공지능(AI)을 구현하는 딥러닝 기술을 이용해 효소의 기능을 신속하고 정확하게 예측할 수 있는 기술이 나왔다. 

 

KAIST는 이상엽 생명화학공학과 특훈교수와 김현욱 교수가 구성한 초세대 협업연구실 공동연구팀이 세포의 대사과정을 이해하는 데 매우 중요한 효소의 기능을 정확하게 예측하는 컴퓨터 방법론 ‘DeepEC’를 개발했다고 2일 밝혔다. 이번 연구결과를 담은 논문은 국제학술지 ‘미국국립과학원회보(PNAS)’ 6월 20일자 온라인판에 게재됐다. 

 

초세대 협업연구실은 신성철 KAIST 총장이 부임하면서 원로 연구자와 신진 연구자, 스승과 제자 등 세대 간 차이를 뛰어넘는 연구자들간 협업 체계를 구축한 모델이다. KAIST는 이번 연구성과가 초세대 협업연구실을 통해 이뤄낸 모범사례로 보고 있다. 

 

효소는 세포 내 생화학반응을 촉진하는 단백질이다. 효소는 다양한 질병 발생 원리 및 생명공학 분야에 밀접한 관련이 있다. 방대한 게놈 정보에서 효소의 기능을 빠르고 정확하게 예측하는 기술은 중요하다. 

 

효소의 기능을 표기하는 시스템 중 대표적인 게 EC번호다. 특정 효소가 이뤄지는 생화학반응 종류에 따라 ‘EC 3.4.11.4’와 같이 총 4개의 숫자로 구성된다. 이 번호를 통해 특정 효소가 어떤 종류의 생화학반응을 매개하는지 알 수 있다는 얘기다. 게놈으로부터 얻을 수 있는 효소 단백질 서열의 EC 번호를 빠르고 정확하게 예측하면 효소 및 대사 관련 문제를 효율적으로 해결할 수 있다. 

 

최근 몇 년 동안 EC 번호를 예측하는 컴퓨터 방법론들이 10개 이상 개발됐다. 이들은 모두 예측 속도, 예측 정확성 및 예측 가능범위에서 부족하다는 평가를 받았다. 생명공학에서 이뤄지는 연구의 속도와 규모에 적합하지 않았다. 

 

연구팀은 138만8606개의 단백질 서열과 이들에게 부여된 EC 번호를 담고 있는 바이오 빅데이터에 딥러닝 기술을 적용해 EC 번호를 빠르고 정확하게 예측할 수 있는 컴퓨터 방법론 ‘DeepEC’를 개발했다. DeepEC는 3개의 합성곱 신경망을 예측기술로 사용하며 합성곱 신경망으로 EC번호를 예측하지 못했을 경우 서열정렬을 통해 EC 번호를 예측한다. 

 

이상엽 특훈교수는 “이번에 개발한 DeepEC를 통해 게놈에 존재하는 방대한 효소 단백질 서열의 기능을 보다 효율적이고 정확하게 알아내는 것이 가능해졌다”고 말했다. 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150