| [현장탐방] ‘개인정보 안심구역’ 시범인증기관, 통계청을 가다 | 2024.03.11 |
[인터뷰] 통계청 송영선 통계데이터허브국장
다양한 결합 데이터 활용, 최대 5년간 자료 보관 가능, 제3자 이용 가능 3월 중에는 개인정보 안심구역으로 최종 지정 예상 [보안뉴스 김영명 기자] 지난해말 통계청은 개인정보보호위원회(이하 개인정보위)로부터 ‘개인정보 안심구역’ 시범인증기관에 선정됐다. 개인정보 안심구역이란 제로트러스트(Zero Trust) 원칙 아래 충분한 보안조치 및 사전·사후적 데이터 처리과정 통제절차 등 안전한 처리환경을 갖추고, 연구자와 기업이 보다 유연하게 개인정보를 처리하도록 지원하는 제도다. 개인정보위는 시범인증기관으로 통계청과 국립암센터 2곳을 선정했다. <보안뉴스>에서는 이 가운데 1곳인 통계청의 송영선 통계데이터허브국장을 만나 개인정보 안심구역 시범인증기관 선정의 의미와 향후 계획 등을 들어봤다. ![]() ▲통계청 송영선 통계데이터허브국장[사진=보안뉴스] 통계데이터센터, 개인정보 안심구역의 ‘시초’ 통계청에서 운영하는 통계데이터센터(Statistics Data Center, 이하 SDC)의 발상은 리서치데이터센터(Research Data Center, 이하 RDC)에 있다. RDC는 2018년부터 설치돼 조사자료를 마이크로데이터로 분석, 유의미한 데이터로 재가공해 기업과 개인에게 제공한다. 현재 SDC는 대전센터를 포함해 13개가 있는데, 3개의 RDC가 SDC로의 개편에 마무리 단계에 있다. 통계청은 현재 전국 110개 기관에서 300여종의 행정자료를 수집해 66종의 새로운 통계 데이터를 생산해내고 있다. 통계청은 개인정보 보호법에 의거한 결합전문기관의 지위와 함께 신용정보법상 데이터전문기관의 지위도 갖고 있다. 통계청은 이 방대한 자료를 필요로 하는 기업과 연구자들에게 효율적으로 제공하기 위한 방안을 찾아왔다. 송영선 국장은 “현재 가명정보 기반의 결합제도는 절차도 까다롭고 결합률도 낮아 데이터의 정확성이 많이 떨어졌다”며, “이에 따라 정확성을 높이면서 제도적인 개선사항도 추가로 반영하겠다는 취지로 개인정보보호위원회에 저희가 먼저 개인정보 안심구역을 신청했다”고 말했다. 이어 “저희는 ‘통계목적고유번호’라는 결합키를 활용해 높은 결합률과 신뢰할 수 있는 양질의 데이터를 생산해 경제 주체들에게 새로운 정보를 제공하는 것이 가장 중요한 취지”라고 강조했다. 데이터 결합률은 가명정보에 기반하기 때문에 3개 기관의 데이터를 결합하면 낮게는 30%, 높아도 78%, 89%에 그친다. 이는 결합기관, 결합되는 데이터의 수, 결합키에 따라 다르다. 국가통계 특화형 개인정보 안심구역은 주민등록번호를 SHA256이라는 모듈을 통해 일방향으로 암호화한 데이터인 통계목적 고유번호를 보유한 통계작성기관들끼리 정보를 공유해 그 결합키로 데이터를 결합하도록 만든 체계다. 이 결합키를 활용해 결합하기 때문에 훨씬 더 결합률이 높고 안전하며 신뢰성이 높다. 통계청은 이를 활용해 대국민 서비스를 확대하고 있다. ![]() ▲통계청 내 개인정보 안심구역과 데이터 반출여부를 결정하는 심사실(좌부터)[사진=보안뉴스] 통계목적 고유번호, 보안성·활용성·신뢰성에서 우수 일반 개인정보는 하나의 정보만으로도 식별이 가능하고, 두 개 이상의 개인정보를 연계하면 바로 개인 식별이 가능하다. 하지만 통계목적 고유번호 자체는 어떤 정보도 없이 단순히 숫자로 된 관리번호여서 이를 활용해 식별할 수 있는 가능성은 제로다. 송영선 국장은 “개인정보는 식별 가능하지만, 통계목적 고유번호는 그 자체로 식별이 불가능하다는 게 가장 큰 차이”라며 “SHA256이라는 그 모듈 자체가 개인정보위에서도 안전성 확보조치 기준에 따라 제시하는 안전한 암호 알고리즘으로 보안성에서도 전혀 문제가 없다는 게 입증됐다”고 말했다. 이 번호를 활용하면 통계작성기관 간에 보유하고 있는 결합 가능한 행정·통계 자료를 활용해 보다 빠르고 정확하게 고품질의 데이터를 생산해 정확성, 신뢰성, 효율성 측면에서 우수하다는 얘기다. 국가기관과 공공기관을 모두 포괄하는 통계작성기관은 전국에 432개가 있다. 이 기관들이 각자 보유한 데이터를 통계목적 고유번호를 활용해서 연계하면 가능하다. 다만 사용 목적에 있어서는 통계 작성, 연구, 공익정보 기록보존 등으로 제한돼 있다. 통계청은 특정 목적으로 심의위원회에 제출하면 심의결과를 바탕으로 자료 반출 여부를 결정하는 절차들을 마련해뒀다. 송 국장은 “가명정보 형성에는 많은 시간과 비용이 들어가지만 일회성으로 활용되고 파괴하기 때문에 이 결합된 데이터가 얼마나 안전하고 우수한 데이터인지 과학적으로 분석할 수 없었다”며, “그래서 이 문제를 해결하기 위해 개인정보 안심구역을 신청, 만들어진 자료를 보관하면서 제3자 이용의 길도 열어둠으로써 데이터의 신뢰성에 대한 과학적 검증이 가능하게 됐다”고 설명했다. 개인정보 안심구역은 크게 세 가지 특징이 있다. 첫 번째는 결합 데이터를 다양하게 활용하는 것, 두 번째는 최대 5년간 자료를 보관하고, 세 번째는 제3자 이용이 가능하다는 것이다. 생산된 새로운 통계 데이터, 활용 가능성은 무한대 결합된 새로운 데이터는 개인정보 안심구역의 특징에 맞게 5년간 보관이 가능하고, 제3자가 사용할 수 있으며, 데이터를 활용해 연결성을 높이고 싶은 기관 등 사용자는 심의위원회 통과만 되면 누구나 사용할 수 있다. 현재는 보건의료 쪽으로 심평원과 암센터, 국민건강보험공단 자료 등이 심의위원회를 통과했다. 통계청의 사망 원인 통계 데이터는 사람이 어떻게 죽었는지 분석한 데이터로, 보건의료 데이터와 사망원인 데이터를 연계해 새로운 데이터를 만드는 실무 협의를 진행중이다. 향후에는 복지, 인구, 고용 등 다양한 분야에서 얼마든지 활용 가능하다. 예컨대 어떤 단체나 연구자가 연구를 위해서 특정 데이터가 필요한 경우 현재는 없지만 몇몇 데이터를 연계하면 원하는 데이터 확보가 가능하다. 만들어진 새로운 데이터셋이 유용하다면 5년간 보관할 수 있고, 제3자도 사용할 수 있는 환경이 개인정보 안심구역에 주어지게 된다. 통계청 개인정보 안심구역은 개인정보보호법상 결합전문기관이자 신용정보법상 데이터전문기관의 지위를 확보했다. 이곳은 네트워크가 차단돼 있고 망분리가 된 PC에서 데이터 결합·분석이 가능하다. 통계청은 2025년 예산으로 개인정보 안심구역 전용 홈페이지 구축에 2억원, 서버 확충 예산으로 63억 정도를 책정할 계획이다. 송 국장은 “홈페이지가 구축되면 개인정보 안심구역 전 과정을 효율적으로 관리할 수 있어 이용자 편의성이 크게 제고될 것”이라며, “인건비는 향후 일정한 수요에 기반해 지속해서 확충해 나갈 계획”이라고 밝혔다. 개인정보 안심구역 1호 준비 완료, 홍보 및 시범사례 발굴 강화 송 국장은 “통계청은 지난해 12월 27일에 조건부 지정을 받았고, 올해 1월 말과 3월 초에 1차, 2차 실사를 마쳤다. 지적됐던 문제들은 대부분 해결됐고, 일부 보완·권고 사항에 대해 시행개선 계획을 제출하면 3월 중에는 개인정보 안심구역으로 최종 지정될 것으로 생각한다”고 말했다. 통계청은 현재 제도적으로는 개정 개인정보보호법 내용도 모두 반영했고, 투팩터 인증이나 관리체계 접근권한, 접속기록관리 등도 조치가 끝나 운영상 준비도 완료했다. 송 국장은 “중장기적으로는 현재 진행 중인 통계정보 플랫폼의 원포털 구축 사업으로, 개인정보 안심구역을 포함해 통계 데이터 허브 플랫폼 구축, 통계 메타데이터 통합관리 시스템 구축, AI 통계 서비스 구축 등 3가지가 주된 내용”이라며, “이는 현재 기재부 예비타당성 조사 과정에 있으며, 통과된다면 2026년부터 3개년 사업으로 추진할 계획”이라고 강조했다. [김영명 기자(boan@boannews.com)] <저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지> |
|
|
|