"중증 코로나19 관련 추정 유전자, 네안데르탈인에게 받았을 가능성 있다"

2020.07.05 16:12
막스플랑크연구소팀 주장..."3번 염색체 유전자 영역 유형 네안데르탈인과 비슷"
핀란드의 고인류 예술가 톰 뷔요클룬트가 그린 9세 네안데르탈인 어린이의 복원도다. 네안데르탈인은 발굴과 연구가 진행될수록 현생인류와 거의 다를 바 없는 생활을 했던 것으로 밝혀지고 있고 현생인류와 혼혈도 이뤄진 것으로 밝혀졌다. 지구에서는 약 4만 년 전 사라졌다. 최근 코로나19 게놈을 연구하는 학자들이 중증 코로나19와 관련 있는 유전자 영역을 네안데르탈인으로부터 약 5만 년 전 물려 받았다는 주장이 나왔다. 위키미디어 제공
핀란드의 고인류 예술가 톰 뷔요클룬트가 그린 9세 네안데르탈인 어린이의 복원도다. 네안데르탈인은 발굴과 연구가 진행될수록 현생인류와 거의 다를 바 없는 생활을 했던 것으로 밝혀지고 있고 현생인류와 혼혈도 이뤄진 것으로 밝혀졌다. 지구에서는 약 4만 년 전 사라졌다. 최근 코로나19 게놈을 연구하는 학자들이 중증 코로나19와 관련 있는 유전자 영역을 네안데르탈인으로부터 약 5만 년 전 물려 받았다는 주장이 나왔다. 위키미디어 제공

중증 신종 코로나바이러스 감염증(COVID-19, 코로나19) 감염과 관련성이 높을 것으로 추정되는 유전자 영역이 수만 년 전 친척 인류 네안데르탈인으로부터 현생인류(호모사피엔스)에게 전달됐을 가능성이 제기됐다. 


스반테 페보 독일 막스플랑크 진화인류학연구소 단장과 스웨덴 카롤린스카연구소 연구팀은 일부 대규모 게놈 연구에서 중증 코로나19 감염과 관련성이 매우 높게 나타난 3번 염색체의 유전자 영역(3q21.31)이 약 5만 년 전 두 인류의 혼혈 과정에서 네안데르탈인으로부터 현생인류에게 전해졌을 가능성이 높다는 분석 결과를 3일(현지시간) 논문 사전공개 사이트 ‘바이오아카이브’에 공개했다. 분석 결과는 정식 논문이 아닌 일종의 초안으로, 아직 동료평가를 거쳐 정식 학술지에 게재되지 않았다.


연구팀은 최근 발표된 일부 연구에서 3q21.31 유전자 영역이 코로나19 감염과 관련성이 높다는 데 주목했다. 지난달 17일 다국적 연구그룹인 ‘중증코로나19 전장유전체연관분석(GWAS) 연구그룹’은 스페인과 이탈리아의 중증 코로나19 환자 1980명의 게놈을 수집, 분석해 그 가운데 1610명의 데이터를 대조군 2205명과 GWAS로 비교 분석했다. 그 결과 중증 코로나19 환자는 3번 염색체의 3q21.31 유전자 영역과 9번 염색체의 9q34.2 유전자 영역이 정상인과 다를 가능성이 매우 높다는 사실을 발견해 미국 의학학술지 '뉴잉글랜드저널오브메디신(NEJM)'에 발표했다.

 

GWAS는 염색체의 전체 위치를 대상으로 특정 형질(질병이나 신체 특성 등)과 관련이 있는 변이가 존재하는지를 통계적으로 탐색하는 기술이다. 30억 쌍의 전체 염기서열이 아닌, 수백만 개의 ‘마커’를 이용해 속도가 빠른 게 특징이다. 


당시 중증코로나19 GWAS 연구그룹이 발굴한 두 유전자 영역 가운데 9q34.2 유전자 영역은 혈액형을 결정하는 ABO 혈액형 유전자가 존재하는 곳으로 많은 주목을 받았다. 이에 따라 중증 코로나19 감염과 혈액형 유형이 서로 관련 있을 가능성도 제기됐지만, 같은 달 27일, 보다 대규모 데이터인 3199명의 코로나19 환자 게놈 데이터를 이용한 ‘코로나19 환자유전학이니셔티브(COVID-19 hg)’ 팀의 연구에 의해 관련이 없는 것으로 판명됐다(관련 기사  "코로나19 감염, 혈액형과 관련 없어" 대규모 게놈 연구 결과). 

 

이에 따라 현재는 3q21.31만이 중증 코로나19 감염과 상관성이 매우 높은 것으로 인정받고 있다. 3q21.31 영역에는 폐의 면역세포 조절에 관여해 호흡기 바이러스에 대응하는 CXCR6 유전자나, 코로나19를 일으키는 바이러스가 인체세포 침투시 활용하는 세포 표면 단백질 ‘안지오텐신변환효소2(ACE2)’와 상호작용하는 단백질을 만드는 SLC6A20 등 6개 유전자가 위치하고 있다.

 

코로나19 환자유전학이니셔티브 연구팀의 연구 결과 중 일부다. 위는 입원환자와 정상인을 연구한 데이터를 모아 분석한 메타분석 결과이고 아래는 경증까지 포함한 환자와 정상인을 비교한 결과다. 가로는 염색체 별 염기서열 영역이고 점은 주요 변이(단일염기다형성)다. 변이 빈도가 높으면 길어진다. 세로축의 길이는 통계적 유의미성을 평가하는 P값의 역서를 로그화한 수치로, 높을수록 해당 염기서열 영역이 표현형(여기서는 코로나19 감염)과 통계적으로 상관관계가 높다는 뜻이다. 가로 빨간선이 GWAS에서 통계적 의미가 있다고 여겨지는 한계 P값인 10억 분의 5다. 이를 넘어서는 염기서열 영역은 3번 염색체 3p21.31뿐이고, ABO 혈액형 유전자가 위치한 9q34.2는 관련이 적은 것으로 나타났다. 코로나19 환자유전학이니셔티브 홈페이지 제공
코로나19 환자유전학이니셔티브 연구팀의 연구 결과 중 일부다. 위는 입원환자와 정상인을 연구한 데이터를 모아 분석한 메타분석 결과이고 아래는 경증까지 포함한 환자와 정상인을 비교한 결과다. 가로는 염색체 별 염기서열 영역이고 점은 주요 변이(단일염기다형성)다. 변이 빈도가 높으면 길어진다. 세로축의 길이는 통계적 유의미성을 평가하는 P값의 역서를 로그화한 수치로, 높을수록 해당 염기서열 영역이 표현형(여기서는 코로나19 감염)과 통계적으로 상관관계가 높다는 뜻이다. 가로 빨간선이 GWAS에서 통계적 의미가 있다고 여겨지는 한계 P값인 10억 분의 5다. 이를 넘어서는 염기서열 영역은 3번 염색체 3p21.31뿐이고, ABO 혈액형 유전자가 위치한 9q34.2는 관련이 적은 것으로 나타났다. 코로나19 환자유전학이니셔티브 홈페이지 제공

페보 단장팀은 3q21.31 영역의 염기서열 약 4만9400개의 ‘연관불평형(LD)’이 매우 높다는 사실에 주목했다. 연관불평형은 긴 유전자 영역에 멀리 떨어져 존재하는 여러 개의 유전자 ‘마커’들의 유형 조합이 어떤 인구 집단에서 고르게 분포하지 않을 때 높게 측정되는 수치다. 예를 들어 A와 a, B와 b라는 대립유전자를 지닌 경우, 대를 거듭하며 유전자가 뒤섞이는 '유전자재조합' 현상에 의해 집단에서는 AB, Ab, aB, ab 네 가지 유형이 고르게 발견돼야 한다. 하지만 어떤 인구 집단에서 만약 Ab라는 특정 유전자형 조합이 유난히 많이 발견되는 경우 LD가 높아진다. 


연구팀은 이런 현상이 나타나는 이유로 3q21.31 영역에서 유전자재조합이 이례적으로 적게 일어났을 가능성과, 이 유전자가 약 4만~6만 년 전 네안데르탈인이나 데니소바인 등 고대 친척인류로부터 새롭게 유입됐을 가능성을 놓고 연구를 했다.


연구 결과 이 영역의 유전자재조합률은 낮지 않은 것으로 나타났다. 반면 일부 고대 친척 인류에게서는 중증 코로나19와 관련된 유전형이 다수 발견됐다.

 

현생인류 수천 명의 게놈을 분석한 ‘1000게놈 프로젝트’의 데이터를 토대로 중증 가능성이 가장 높은 유전형 및 그와 염기서열 1개만 다른 유사 변이 유전형 14개를 추렸다. 그 뒤 이들 유전형을 다른 고대 친척인류의 게놈 데이터에서 찾은 결과 크로아티아 빈디야 동굴에서 발견된 약 5만 년 전 네안데르탈인 화석의 DNA는 12개를, 러시아 알타이산맥 부근에서 발굴된 12만~5만 년 전 네안데르탈인 화석 DNA에서는 4개를 갖고 있는 것을 확인했다.

 

반면 데니소바인 게놈에서는 발견되지 않았다. 연구팀은 이를 토대로, 이 유전자 영역이 동유럽의 5만 년 전 네안데르탈인으로부터 유입됐을 가능성이 높다고 해석했다.

 

독일 막스플랑크 진화인류학연구소 연구원들이 2010년 네안데르탈인의 게놈을 최초로 해독했을 때 공개한 작업 모습. 수만 년 전 화석에 남은 소량의 DNA를 위해 가루 시료를 끌어내고 있다. 시료 추출 이후에는 차세대 염기서열 해독 기술로 전체 게놈을 복원한다.
독일 막스플랑크 진화인류학연구소 연구원들이 2010년 네안데르탈인의 게놈을 최초로 해독했을 때 공개한 작업 모습. 수만 년 전 화석에 남은 소량의 DNA를 위해 가루 시료를 끌어내고 있다. 시료 추출 이후에는 차세대 염기서열 해독 기술로 전체 게놈을 복원한다.

연구팀은 이어 이 유전자 영역이 50만 년 전에 존재했던 현생인류와 네안데르탈인의 공통조상에게서 물려 받았을 가능성도 확인했다. 그 결과 공통조상에서 물려 받았을 경우 유전자 재조합이 활발히 일어나 현재의 높은 LD를 유지하기 어려운 것으로 나타났다. 공통조상에게 유래했을 가능성이 매우 낮다는 뜻이다. 연구팀은 이를 바탕으로 이 유전자 영역이 5만 년 전 유럽 지역의 네안데르탈인에게 왔을 가능성이 높다고 결론 내렸다.


연구팀은 1000게놈 프로젝트 데이터를 이용해 이 유전자형 및 관련 변이형이 어느 대륙에 많이 분포하는지 비교했다. 그 결과 남아시아에서 30%, 유럽에서 8%, 북미 및 중남미인에게 4% 발견됐다고 밝혔다. 국가 중 가장 높은 곳은 방글라데시로 인구의 63%가 이 유전자형을 보유한 것으로 나타났다. 반면 아프리카인은 이 유전자형이 거의 발견되지 않았고 동아시아인 역시 빈도가 4% 이하로 낮았다(아래 지도). 아프리카에서 이 유전자형이 거의 발견되지 않은 것은 현생인류가 아프리카를 벗어나 약 6만 년 전쯤 지금의 서아시아지역 부근에서 네안데르탈인과 만나 피를 섞으면서 이 유전자형이 전해졌기 때문으로 풀이된다. 


연구팀은 이번 연구가 왜 코로나19가 어떤 사람에게는 더 심각한 증상을 불러 일으키는지 밝히는 데 도움이 되길 기대하고 있다. 연구팀은 “이 네안데르탈인에게서 유래한 이 유전자 영역의 어떤 특징이 중증 코로나19에 위험을 초래하는지, 이런 특징이 현재의 코로나바이러스 외에 다른 병원체에게도 영향을 미치는지는 모른다”며 “하지만 현재의 팬데믹에서 네안데르탈인으로부터의 유전자 흐름이 비극적 결과를 가져온 것만은 확실하다”고 말했다.

 

연구팀은 주요 지역 별 인류의 게놈 특성을 바탕으로 어느 지역에 중증 코로나19 관련 유전형이 많이 분포하는지 확인했다. 남아시아 지역이 30%로 높게 나타났으며 특히 방글라데시가 이 유전자 유형을 가장 높게 보유한 것으로 나타났다. 유럽도 8%로 높았으나 동아시아는 4% 이하로 낮았고, 아프리카는 거의 존재하지 않았다. 바이오아카이브 논문 초안 캡쳐
연구팀은 주요 지역 별 인류의 게놈 특성을 바탕으로 어느 지역에 중증 코로나19 관련 유전형이 많이 분포하는지 확인했다. 남아시아 지역이 30%로 높게 나타났으며 특히 방글라데시가 이 유전자 유형을 가장 높게 보유한 것으로 나타났다. 유럽도 8%로 높았으나 동아시아는 4% 이하로 낮았고, 아프리카는 거의 존재하지 않았다. 바이오아카이브 논문 초안 캡쳐

페보 단장은 처음으로 고인류의 화석에서 고DNA 파편을 분리해 해독, 분석하는 고게놈학을 개척한 학자다. 2010년 처음으로 네안데르탈인 고게놈 초안을 해독해 발표했으며 이 과정에서 약 6만 년 전 유라시아 대륙에서 네안데르탈인과 현생인류 사이에 혼혈이 있었음을 처음 증명했다. 이후 최초의 데니소바인 고게놈 해독 등 주요한 고게놈 연구를 주도해 왔다. 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150