"데이터 넘치는 시대, 통계학자 찾지 않는 사회 입을 피해 막대할 것"

2019.09.05 08:18
2019년 인촌상 과학기술 부문 수상자 박병욱 서울대 통계학과 교수. 한국연구재단 제공
2019년 인촌상 과학기술 부문 수상자 박병욱 서울대 통계학과 교수. 한국연구재단 제공

“사람들은 흔히 나이가 많거나 돈이 많으면 보수화되고, 교육수준이 높으면 진보성향을 띤다고 생각합니다. 통계로 제대로 연구해 보면 조금 다릅니다. 나이는 맞는데, 돈은 영향이 없더군요. 교육은 오락가락합니다. 교육을 어느 정도 받을 때까진 보수성향이 강해지지만, 교육 기간이 더 길어지면 진보성향으로 돌아서죠.”

 

박병욱 서울대 통계학과 교수는 데이터로 말하는 통계학자다. 데이터에서 법칙을 찾고 이를 바탕으로 미래를 예측하는 이론을 연구한다. 특히 데이터가 추출된 곳(모집단)의 형태와 관계 없이 데이터를 분석하는 ‘비모수추론’이라는 분야의 전문가다. 숫자가 아닌 함수를 데이터로 쓰거나, 꼬리표가 달리듯 조건이나 제약이 있는 데이터를 분석한다. 일반적인 통계 방법론에 비해 어렵고 연구도 잘 안 돼 있다.


박 교수가 2017년 대선 데이터를 분석한 연구가 대표적이다. 전국 지역구별 진보, 보수, 중도 후보 3명의 득표 비율을 조사한 뒤, 지역구의 평균 나이와 교육 연한, 주거지 시세, 보험료 액수, 전 해 총선 득표수 등을 바탕으로 지역구 득표를 예측하는 모형을 개발했다. 후보 세 명의 득표 비율을 합쳐서 1이 된다는 ‘제약’이 있다. 이런 데이터는 기존 통계 기법으로는 제대로 분석이 안 된다. 박 교수는 새로운 방법으로 이를 분석했고, 재산과 교육 등에서 상식을 깨는 결과가 나왔다.

 

박 교수가 이렇게 까다로운 통계 이론에 매달리는 까닭은 오늘날이 데이터의 시대기 때문이다. 데이터의 양이 크게 늘고 복잡해졌다. 정보의 옥석을 가리기는 더 힘들어졌다. 잘못된 분석에 의한 가짜뉴스가 횡행하고, 포털 뉴스사이트와 사회관계망서비스(SNS)는 잘못된 정보에 따른 편 가르기 싸움으로 늘 시끄럽다. 그는 “학계도 예외는 아니다”라며 “과거에는 100편 중 좋은 논문이 1~2편 숨어 있었다면, 지금은 1000편에서 1~2편을 찾아야 하는 수준”이라고 말했다.


많은 전문가들이 데이터에 길이 있다고 말한다. 데이터를 분석하면 정확한 답을 찾고 미래를 예측할 수 있다고 주장한다. 데이터과학이라는 신조어가 탄생했다. 관련 학과와 대학원이 신설되고, 통계학과 교과목을 수강하는 학생도 늘고 있다.

 

하지만 정작 박 교수는 “통계는 정확한 답을 주는 학문이 아니다”라고 강조한다. 숙명과도 같은 불확실성이 매사에 내포돼 있다는 게 이유다. 그는 “미래 예측은 늘 틀릴 가능성이 있다”며 “다만 그럼에도 통계학이 유용할 수 있는 것은, 바로 그 불확실성 계량화하고 조금이라도 줄여나가려 노력하기 때문”이라고 말했다.

 

박 교수는 지난해에는 4년에 한 번씩 개최되는 ‘수학자들의 올림픽’ 세계수학자대회에서 초청강연을 했다. 통계학자로서는 매우 이례적인 일이다. 순수수학에서도 박 교수의 이론 업적을 인정한다는 뜻이다. 작년에는 전세계 통계학자 및 전문가의 국제기구인 국제통계기구(ISI)의 부회장에 당선돼 올해 8월 취임했다. 그가 한국 통계학계를 대표할 수 있는 학자 중 한 명이라는 데에 이의를 제기할 사람은 많지 않다.


그런 그지만, 인촌상 과학기술 부문 수상은 꿈에도 생각하지 못했다고 했다. 데이터 시대에, 역설적으로 데이터를 다루는 전문가인 통계학자가 설 자리는 별로 없다고 느끼기 때문이다. 통계에 대한 조예 없이 데이터를 함부로 재단하고 해석한 말이 넘쳐난다. 이에 따라 왜곡된 사실이나 잘못된 정보가 퍼진다. 박 교수는 “몸이 아플 때 의사를 찾는 일은 상식이 됐지만, 통계 분석이 필요할 때 통계학자를 찾아야 한다고 생각하는 사람은 아직 별로 없는 것 같다”며 안타까워했다. 의사를 찾지 않는 사람은 자신만 손해지만, 통계학자를 찾지 않는 사회는 그 피해가 사회 전체에 미친다. 그는 “인촌상 수상이 통계의 중요성을 사회에 알리는 계기가 되면 좋겠다”고 말했다.


● 공적
고통스러운 이론 증명 과정을 마치고 그 내용을 논문으로 쓸 때 어떤 취미보다 큰 즐거움을 느낀다는 천생 학자다. 서울대 계산통계학과에서 학사와 석사를 받고 미국 버클리 캘리포니아대에서 통계학 박사 학위를 받았다. 미국 노스캐롤라이나대 교수를 거쳐 1988년부터 서울대 통계학과에서 교수로 재직중이다. 통계학 분야 양대 학술지로 꼽히는 ‘미국통계학협회저널(JASA)’과 ‘통계학 연보’ 등에 발표한 30여 편의 논문을 포함해 총 140여 편의 논문을 발표했다. 2018년 브라질에서 열린 ‘수학자들의 올림픽’ 세계수학자대회에서 통계학자로서는 이례적으로 초청강연을 했으며, 올해 8월 국제통계기구(ISI) 부회장에 취임했다.
 

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150