[암호기술 혁명]①현존 가장 안전한 보안기술 동형암호

2018.11.24 11:00
이미지 확대하기′4세대 암호′로 불리는 동형암호는 현존하는 가장 안전한 보안 기술로 평가 받고 있다. 디자인 현진
'4세대 암호'로 불리는 동형암호는 현존하는 가장 안전한 보안 기술로 평가 받고 있다. 디자인 현진

오전 7시 30분, 교통카드를 찍고 지하철을 탄다. 출근길에는 스마트폰으로 어젯밤 온라인 쇼핑몰에서 장바구니에 넣어 놓은 물건을 결제한다. 회사에 도착해 지문인식 장치에 손가락을 대고 사무실에 들어온다. 매일 반복되는 일상생활이 별 탈 없이 유지되는 이유는 사실 암호 덕분이다. 교통카드 단말기에 신용카드가 닿는 순간에는 카드 정보를, 쇼핑몰에서 결제가 이뤄지는 순간에는 이름과 공인인증서 공개키를, 지문인식 장치에 손가락이 닿는 순간에는 생체정보를, 모두 암호기술이 보이지 않게 내 정보를 지켜주고 있다. 최근 암호학계에서는 ‘동형암호’가 각광받고 있다. 빅데이터와 자율주행자동차, 사물인터넷(IoT)으로 대변되는 4차 산업혁명 시대를 이끌 차세대 암호다. 그리고 그 뿌리에는 수학이 있다.

 

암호가 전 세계적으로 이처럼 주목받은 적이 있었을까. 세계 경제를 들썩거리게 만든 암호화폐 때문만은 아니다. 그보다 더 파급력이 큰 보안 이슈 때문이다. 그 중에서도 최근 암호학계에서 가장 주목하는 기술은 동형암호(同型暗號·Homomorphic Encryption)다. ‘4세대 암호’로 불리는 동형암호는 현존하는 가장 안전한 보안 기술로 평가 받고 있다.

 

 

서울대, 동형암호 기술 가장 앞서

 

“우리처럼 데이터를 다루는 기업은 동형암호가 꼭 필요합니다. 동형암호가 법의 테두리 안에서 빅데이터를 활용할 수 있게 해주길 기대하고 있습니다.”

 

3월 15일(현지 시간) 미국 매사추세츠공대(MIT)에서 열린 ‘동형암호 표준화 국제회의’에 참석한 데이비드 캐럴 마이크로소프트(MS) 수석 프로그램책임자는 세계적으로 개인정보보호법이 강화되고 있는 추세에서 빅데이터 분석 산업이 위축되지 않으려면 동형암호가 필요하다는 취지로 이 같이 말했다.

 

이미지 확대하기자료 : 수학기반 산업데이터해석 연구센터
자료 : 수학기반 산업데이터해석 연구센터

동형암호는 정보를 암호화한 상태에서 각종 연산을 했을 때, 그 결과가 암호화하지 않은 상태의 연산 결과와 동일하게 나오는 4세대 암호체계를 말한다. 마치 책을 펴지 않은 상태에서 책에서 가장 많이 나온 단어가 무엇인지, 주인공이 누구인지 맞히는 것과 비슷하다.

 

정보가 암호화돼 있기 때문에 해커가 정보를 탈취하더라도 정보가 노출되지 않는다. 암호화한 상태에서나 하지 않은 상태에서 분석한 결과물의 형태가 같다는 의미에서 ‘동형(同型)’이라는 이름이 붙었다.

 

동형암호는 결과를 얻기 위해 암호를 푸는 과정을 거치지 않아도 된다는 점에서 기존의 1~3세대 암호체계와 구분된다. 이론적인 연구는 1978년부터 시작됐지만, 크레이그 젠트리 IBM 왓슨연구센터 연구원이 2009년 실질적인 돌파구를 마련하면서 빠르게 발전하기 시작했다.

 

동형암호가 주목받는 이유는 빅데이터 시대를 맞아 개인 정보 보안이 화두로 떠올랐기 때문이다. 현재 MS와 IBM 등 글로벌 IT 기업은 자체적으로 동형암호를 개발하고 있다. 자사의 빅데이터 분석 서비스를 이용하는 기업이 정보를 안전하게 보호하는 동시에 효과적으로 활용하도록 돕기 위해서다.

 

크리스틴 라우터 MS연구소 암호연구그룹 연구책임자는 “MS는 헬스케어, 금융, 제약, 로봇, 자동차 등 MS의 클라우드 서비스 ‘애저(Azure)’를 이용하는 기업 고객들이 안전하게 서비스를 이용할 수 있도록 동형암호를 적용하는 기술을 개발 중”이라고 말했다.

 

대개 정보 유출은 암호화시킨 정보를 풀었다가 다시 암호화하는 과정을 반복하는 중에 발생한다. 이 과정에서 여러 사람이 정보에 접근할 수 있는 상황이 만들어지기 때문이다. 하지만 동형암호처럼 암호화된 정보를 풀지 않은 상태에서 정보를 분석할 경우 정보 유출의 위험이 거의 사라진다. 이런 장점 때문에 MIT가 발행하는 ‘MIT 테크놀로지리뷰’는 2011년 동형암호를 10대 미래기술 가운데 하나로 선정했다.

 

이미지 확대하기일러스트 동아사이언스 제공
일러스트 동아사이언스 제공

현재 동형암호를 상용화할 수 있는 기술을 가진 연구팀은 MS, IBM, 서울대 등 전 세계 5개 그룹 정도로 극소수다. 그 중에서도 천정희 서울대 수리과학부 교수가 이끄는 ‘수학기반 산업데이터해석 연구센터’가 개발한 동형암호 프로그램 ‘혜안(HEAAN)’은 활용 범위와 연산 속도 등에서 가장 앞선 것으로 평가받고 있다.

 

수학기반 산업데이터해석 연구센터는 2017년 7월 과학기술정보통신부의 지원으로 개설됐으며, 천 교수가 센터장을 맡아 산업계가 당면한 문제의 해법을 수학에서 찾는 연구를 수행하고 있다.
현재 MS, IBM 등이 개발한 프로그램은 정수를 연산하는 수준에 머물러 있는 반면, 혜안은 실수를 빠른 속도로 연산할 수 있어 빅데이터를 분석하는 기계학습(머신러닝) 과정에 바로 적용할 수 있다. 혜안에는 ‘근사 계산’이라는 방식이 적용됐다. 계산 결과에 큰 영향을 미치지 않는 소수점 아래 작은 값들을 버려가면서 빠르게 계산하는 방식이다. 천 센터장이 이끄는 연구팀은 이 원리를 담은 연구 논문을 4월 30일 이스라엘 텔아비브에서 개최된 암호학 분야 최고 권위의 국제학술대회인 ‘유로크립트(EUROCRYPT) 2018’에서 처음 발표했다.

 

동형암호, 왜 안전한가

 

동형암호는 현존 최강 암호체계 중 하나로 꼽히는 ‘격자기반암호’의 한 종류다. 격자기반암호란 수학계에서 절대 답을 찾을 수 없다고 알려진 ‘격자 문제(lattice problem)’를 응용한 암호를 말한다.

 

동형암호를 포함한 격자기반암호는 양자컴퓨터가 도입돼도 깨지지 않는 차세대 암호체계라는 것이 암호학계의 중론이다. 현재 전자상거래 등에 널리 쓰이는 RSA 같은 기존 암호체계는 양자컴퓨터가 도입되면 붕괴될 수밖에 없다. 양자컴퓨터는 큰 수의 소인수분해와 데이터베이스 검색을 매우 효과적으로 수행할 수 있다고 알려져 있는데, RSA의 토대가 소인수분해이기 때문이다.

 

반면, 격자 문제는 아직까지 해법을 찾지 못했다. 격자 문제는 일종의 최단거리를 찾는 문제다. 가령 2차원 좌표평면 위에 격자 모양으로 점을 찍는다고 하자. 원점을 기준으로 (1, 1), (1, 2) 등 점들이 생길 것이다. 여기서 원점과 가장 가까운 점을 찾으라고 하면 답은 쉽다. (1, 0), (0, 1) 같은 점들이다. 하지만 200차원 등으로 차원이 확장되면 답을 찾는 일이 매우 어려워진다.

 

격자 문제는 ‘현재로서는 풀 수 있음이 증명되지 않은 문제’인 ‘NP 완전 문제(NP complete problem)’로 분류돼 있다. 미국 클레이수학연구소는 NP 완전 문제가 풀 수 있는 문제임을 증명하는 것을 포함해 수학계의 주요 미해결 문제(밀레니엄 문제) 7가지를 선정하고, 각 문제를 해결한 사람에게 100만 달러를 주겠다고 발표한 바 있다. 하지만 아직까지 ‘푸앵카레 추측’ 외에는 해결된 문제가 없다. 그만큼 동형암호도 풀기 어렵다는 뜻이다.

 

이향숙 이화여대 수학과 교수(대한수학회장)는 “현재 대부분의 수학자들이 NP 완전 문제는 풀 수 없는 문제로 보고 있다”며 “만약 NP 완전 문제가 풀 수 있는 문제로 증명되면 보안을 비롯해 NP 완전 문제를 토대로 설계한 수많은 컴퓨터 시스템에 혼란을 초래할 것”이라고 말했다. 

 

암호화된 상태에서 정보 분석

 

동형암호가 암호화된 상태에서 정보를 분석할 수 있는 원리는 이렇다(왼쪽 그림 참고). 예를 들어 암호화하는 정보가 10과 15라고 가정하자. 디지털 데이터는 이진수로만 처리되므로 이진수로 변환한 뒤에 암호화된다. 문자도 마찬가지다. 편의상 여기서는 이진수로 변환하지 않고 설명한다.

 

10과 15를 동형암호로 암호화한 결과를 쉽게 말하면 각각에 매우 큰 수(비밀키)를 더한 값이다. 예컨대 10과 15를 12345라는 비밀키로 암호화한 수는 10+(12345×3), 15+(12345×5) 같은 수가 될 수 있다. 여기서 3과 5는 비밀키를 감추기 위해 임의로 부여하는 수다.

 

이제 데이터 분석을 위해 10과 15를 더하는 상황을 가정해 보자. 암호화한 결과끼리 더하면 10+15+12345(3+5) =98785가 나온다. 이 경우 덧셈 결과는 매우 크고 복잡한 수(98785)가 되지만 구조적으로 10과 15를 더한 값에 12345라는 큰 수의 배수를 더한 값이기 때문에, 비밀키(12345)로 암호를 해독하면 답은 25라는 점을 어렵지 않게 알 수 있다. 즉, 암호화하지 않은 정보를 더한 결과와(10+15=25) 암호화한 정보를 더한 뒤 암호를 푼 결과가(25) 같다. 암호가 걸린 상태에서도 분석이 가능하다는 뜻이다. 천 센터장은 “이보다 더 복잡한 분석도 결국 수학적인 연산으로 변형되기 때문에 동형암호로 암호화한 상태에서 분석할 수 있다”고 말했다.

 

관련기사 : 과학동아 2018년 5월호, 암호기술 혁명, 동형암호

메일로 더 많은 기사를 받아보세요!

댓글 0

작성하기

    의견쓰기 폼
    0/150