빅데이터활용 VS 개인정보보호, 두 마리 토끼 잡는다

2017.12.20 21:10

#.질문 하나

희귀병 연구를 위해 환자의 게놈 데이터가 필요하다. 데이터가 많을수록 연구하기 좋은데, 희귀병은 환자도 희귀해 진료 데이터가 적다. 여러 병원에서 방문한 환자의 진료 기록을 모아 연구할 수 있을까?

 

#.질문 둘

금융 정보를 이용해 고객의 신용 정보를 평가하고 싶다. 그런데 고객이 아직 취업 전이라 금융 데이터가 없다. 휴대전화 요금 납부를 꾸준히 해왔는지 살피면 신용 정보 평가에 도움이 될 것 같다. 이 정보와 금융 정보를 함께 분석할 수 있을까?

 

빅데이터 시대가 되며 마주할 수 있는 문제들이다. 현재 위 두 질문의 답은 '아니오'다. 병원 간 환자 데이터 공유는 법적으로 금지돼 있다. 휴대전화 요금 납부 정보와 금융 정보를 합치려면 개인정보를 알아볼 수 없게 하는 '비식별화' 조치가 필요한데, 이 과정에서 데이터 손실이 불가피하다.

 

이미지 확대하기(주)동아사이언스 제공
서울대 수리과학부 천정희 교수. 수학동아 2014년 3월호

이 문제를 해결해 빅데이터 활용과 개인정보 보호라는 두 마리 토끼를 잡을 수 있는 기술적 대안이 나왔다. 과학기술정보통신부는 서울대 수리과학부 천정희 교수팀이 개인의 정보를 암호화된 상태 그대로 보호한 채 분석해 개인정보 유출 위험을 원천적으로 차단한 새로운 암호 기술을 개발했다고 20일 밝혔다. 천 교수팀은 10월 미국 올랜도에서 열린 ‘게놈 데이터 보호 경연대회’에서 마이크로소프트 연구소, 스위스 로잔연방공대 등을 누르고 부문별 1위를 차지하며 기술력을 입증 받았다.

 

 

천 교수팀가 개발한 기술은 ‘동형암호’ 기법이다. 동형암호는 원래의 데이터를 수학 함수를 이용해 변형시켜 알아볼 수 없게 암호화시킨 뒤, 이를 암호가 걸린 상태 그대로 분석하는 수학 알고리즘이다. 이 때 분석 결과는 암호를 걸기 전의 데이터로 분석한 결과와 똑같아야 한다. 마치 금고 안에 책을 넣고 잠근 뒤에, 금고를 열지 않은 채로 책을 분석해 줄거리가 무엇인지 사진은 몇 개 들어있는지 등을 아는 것과 비슷하다. 권규녑 과기정통부 정보보호기획과 사무관은 “개인정보가 암호화된 상태이기 때문에 설사 데이터가 유출되더라도 문제가 없다”고 말했다.


천 교수팀은 정보를 컴퓨터의 정보 단위인 ‘비트’ 단위로 처리하던 기존의 동형암호를 개선했다. 먼저 수십 개의 비트로 구성된 현실의 수를 직접 이용하는 방식으로 동형암호의 속도를 수백 배 높였다. 이 과정에서 긴 수를 근사계산을 이용해 빠르게 수행하는 방법을 도입했다. 천 교수는 "데이터 크기가 커지면 속도 차이는 더욱 커진다"고 말했다. 천 교수팀은 이 새 알고리즘을 이용해 1500명의 유전자 해독 정보 수천 개를 암호화시킨 상태 그대로 정확히 분석해 유방암 발생 유전자의 변이 유무를 빠르게 판단하는 데 성공했다.

 

이미지 확대하기
동형암호기술의 개념. 수학동아 2014년 3월호
새로운 동형암호는 금융 분야에서도 활용될 수 있다. 천 교수는 “빠르면 1~2년 안에 적용도 가능할 것”이라고 말했다. 또 동형암호 기술의 표준화도 추진 중이다. 마이크로소프트, IBM, 매사추세츠공대(MIT) 등과 함께 논의를 시작했다.

 

본격적인 활용을 위해서는 법적으로 해결할 부분도 있다. 천 교수는 “암호화된 개인정보를 규정하는 구체적인 법이 현재는 없다"며 "현재로서는 활용에 큰 무리가 없어 보이지만, 보다 활성화하려면 제도 개선이 필요할 것”이라고 말했다.

 

권 사무관은 “행정안전부, 국회 과학기술정보방송통신위원회 등과 함께 규제에 관해 논의하고 있다”며 "동형암호는 물론 블록체인 등 기술적 진전을 잘 이용해 개인의 동의 하에 개인정보를 안전하게 관리할 수 있도록 정책을 추진할 예정"이라고 말했다.

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150