"변수 많은 코로나19, 수리모델로 예측하기 어렵다"

2020.12.22 17:22
21일 국제학술지 감염병관리및병원역학

 

 지난 1일 오후 부산 연제구 한 주차장에서 코로나19 환자들이 대구 동산병원으로 이송되고 있다. 연합뉴스 제공
지난 1일 오후 부산 연제구 한 주차장에서 코로나19 환자들이 대구 동산병원으로 이송되고 있다. 연합뉴스 제공

신종 코로나바이러스 감염증(COVID-19·코로나19) 사태 이후 한국을 비롯한 세계 각국은 방역 대책 수립을 위해 ‘감염병 수리모델’을 적극 활용하고 있다. 감염병 수리모델은 감염병이 퍼져 나가는 상태를 나타내는 수학식을 만들어 전파 상황을 분석하고 향후 전개될 양상을 예측하는데 활용되는 분석 모델이다. 세계보건기구(WHO)와 각국의 방역당국은 대부분 각국의 현실에 맞는 수리모델을 개발하고 그 결과를 바탕으로 방역조치를 내놓고 있다. 하지만 감염병 수리모델이 코로나19엔 작동하지 않을 수 있다는 분석이 나왔다.


감염병 수리모델 전문가인 스리니바사 라오 미국 오거스타의대 이론수리모델링연구소장은 감염병 수리모델링이 코로나19의 확산을 예측하는 데 최선의 방법이 아니라는 내용의 서신을 국제학술지 감염병관리및병원역학 21일자에 발표했다.


감염병 예측에 사용되는 수리모델에는 주로 ‘SEIR’가 사용된다. SEIR는 감염 의심(Suspectible), 노출(Exposed), 감염(Infectious), 회복(Removed)이라는 의미의 영어 단어 앞 글자를 따온 말이다. 감염 가능성이 있는 사람을 네 단계로 대상을 나누고 시간 흐름에 따라 환자 발생 상황을 예측한다. 모델 속 네 가지 단계에 속하는 사람의 수에 따라 감염병 전파 양상을 시간 흐름대로 볼 수 있다. 


감염병 수리모델의 결과는 ‘감염재생산지수(R)’로 표현된다. 확진자 1명이 몇 명의 사람을 감염시키는 지 나타낸다. 감염재생산지수가 2일 경우, 1명이 2명을 감염시킨다는 의미다. 정은경 중앙방역대책본부장(질병관리처장)이 21일 정례브리핑에서 밝힌 다음 주 확진자가 1000~1200명 정도 나올 수 있다는 분석도 감염재생산지수를 따져서 나온 결과다. 정 본부장은 지난 주 산출한 감염재생산 지수가 1.28라고 밝혔다. 이는 여전히 감염자가 지속적으로 늘어날 수 있음을 시사한다. 


라오 소장은 서신에서 현재 코로나19의 상황을 고려하면 모든 사례를 추적하는 게 불가능해졌다고 말했다. 코로나19 확진 사례가 폭발적으로 증가하면서 감염병 수리모델에 쓰일 충분한 데이터들을 수집할 수 없어졌다는 분석이다. 또 코로나19 확산을 막기 위해 각국에서 취하고 있는 봉쇄 전략이 코로나19의 확산을 예측하는 것을 복잡하게 만들었다고 설명했다. 감염병 수리모델링을 통한 확산 예측에 변수가 너무 많아졌다는 것이다.


라오 소장은 기존 감염병 수리모델 대신 ‘기하평균’ 모델을 이용해 예측의 범위를 줄이는 방식을 제안했다. 기하평균은 여러 개의 수를 연속으로 곱해 그 개수의 거듭제곱근으로 나눈 수다. 인구성장률이나 경제성장률 등 변동이 큰 성장률의 평균을 구할 때 적용된다. 라오 소장은 최근의 감염 확진 사례의 변동률을 따져 먼 미래보다는 가까운 미래를 예측해야 한다고 말했다. 예측의 범위를 줄여 변수를 최대한 줄이고, 오늘의 확진 수를 따져 내일의 확진 정도를 예측하자는 것이다. 


라오 소장은 “기하평균을 이용한 예측방법은 예측의 범위가 넓진 않지만 단기간에 더 정확한 예측을 내놓을 수 있다”며 “기존 감염병 수리모델은 봉쇄 등 코로나19 방역 조치가 부과되는 상황들을 날마다 반영할 수 없으며 이미 수 많게 예측이 빗나갔다”고 말했다.


감염병 수리모델 자체의 한계는 이미 지적된 바 있다. 다비드 파란다 프랑스 국립과학연구센터(CNRS) 연구원팀은 영국 런던수학연구소와 임페리얼칼리지런던대, 일본 홋카이도대 연구팀은 지난 5월 감염병 수리모델의 예측 정확도가 떨어지는 이유를 분석한 결과를 국제학술지 ‘카오스’ 에 공개했다.


연구팀은 기존에 사용하는 감염병 수리모델이 몇 가지 가정에만 의존하고 있다는 점을 한계로 들었다. 예를 들어 수리모델에서는 코로나19에 노출된 환자는 사람을 통해서만 전염이 된다고 가정하고 있다. 하지만 실제 상황에서는 사람이 아닌 손잡이나 책상에 뭍어있는 바이러스를 통해 감염되기도 한다. 또 코로나19에 걸렸다가 회복한 환자나 사망자들은 영원히 면역력을 가진다고 가정한다. 하지만 코로나19에 걸린 환자의 면역력이 얼마나 지속되는 지 언제 면역이 생성되는 지는 사실 아직까지 밝혀진 것이 없다. 

 

연구팀은 예측 모델에 들어가는 데이터의 질도 떨어진다는 점을 지적했다. 한 예로 이탈리아에서는 환자와 접촉했더라도 증상이 나타나지 않으면 진단 검사를 하지 않았고 보고가 늦어지는 사례가 빈번했다. 초기 발원지로 지목된 중국도 전체 환자 통계에 무증상 환자를 넣었다뺐다를 반복하고 있으며, 아프리카 국가들은 정확한 환자 수가 집계되지 않고 있다.

 

반면 한국은 접촉차를 포함해 매일 1만5000~2만명을 검사하고 있다고 실시간 보고되고 있다. 나라마다 수집하는 데이터의 기준과 보고 시점이 다른 것도 정확한 예측 모델을 만드는데 한계가 되고 있다는 지적이다. 연구팀은 “환자 수 집계가 20%만 달라도 이는 전체 감염 환자 추정치를 수천명에서 수백만명으로 바꿔버린다”고 말했다.


감염병의 역학적 특성이 예측불허로 바뀌는 것도 수리모델의 정확성을 떨어뜨리는 요인으로 작용한다. 연구팀은 “초기 확산 단계에서는 외부 영향에 극히 민감하다”고 말했다. 이런 이유로 도시 봉쇄 등 방역조치를 결정할 때는 감염병 수리모델에 들어가는 데이터 선택에 고심을 해야 한다고 설명했다. 
 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150