보안 시스템에 있어서 사회적으로 요구되는 것을 개발하는 것은 매우 중요한 일이다. 기술이 발전해 사회에 먼저 제시될 수도 있지만, 당면한 요구가 있기에 기술을 개발해야만 하는 경우도 있다. 그러나 어떤 요구가 있다고 해서 그에 해당하는 보안 시스템을 개발해 대응하는 것이 시장의 수요를 만족시키는 방법인지, 법적으로 강제할 수 있는 사항인지는 면밀히 고려해 볼 일이다.
최근 보안 시스템 개발자에게 이러한 고민을 하게 만든 사건이 일어났다. 2010년 3월 국가보훈처 앞에서 시위를 하던 최모 씨가 잠시 자리를 비운 사이에 휠체어 등 시위용품이 훼손된 사건에 대해 최 씨는 국가보훈처 청사 현관 출입구의 CCTV 영상녹화물을 공개해달라고 청구를 했다.
그러나 국가보훈처와 중앙행정심판위원회는 개인의 사생활 침해를 우려를 이유로 거부하고, 최 씨는 행정법원에 ‘정보공개청구거부결정처분취소소송(2010구합44160)’을 냈다. 이에 서울행정대법원은 지난 8월 18일 원고일부승소 판결을 통해 “CCTV 녹화물은 원고의 물건 등을 누가 고의적으로 손괴했는지를 확인할 수 있는 정보에 해당하고, 공개로 인해 원고의 알권리를 보장하고 원고의 의혹을 해소한다는 측면에서 공개할 필요성이 크다”고 밝혔다.
다만 “녹화물에 포함돼 있는 일반 통행인의 얼굴을 공해하지 않더라도 손괴행위를 확인하는데 지장이 없으므로 특정인을 식별할 수 있는 개인에 관한 정보를 모자이크 처리 등의 방법으로 지우고 공개해야 한다”고 조건을 붙였다.
얼굴 모자이크 처리에 대한 4가지 특성
필자는 이번 사건을 통해 요구되는 보안 시스템 개발 요구에 대해 다음과 같은 몇 가지 주안점을 두고 설명하고자 한다.
첫째, 이 판결을 통해 ‘사생활 보호를 위한 통행인의 얼굴 모자이크 처리’ 솔루션의 개발 필요성을 곧바로 도출하기 전에 해당 사건의 구조적인 특성을 먼저 살펴볼 필요가 있다. 이 사건의 경우 교통사고나 범죄사고 등 일반적인 사건으로 경찰이 CCTV 등 다양한 근거자료를 조사해 시시비비를 신속히 가려줄 수 있는 것과 달리, 국가기관 대 개인의 구조라는 점이다. 즉, 국가기관이 사생활 보호를 근거로 CCTV 영상 공개를 거부하더라도 경찰이 나설 수 없는 상황이고, 개인은 지난한 법적인 절차를 거쳐 확인할 수밖에 없는 상황이었다. 또한, 시위자의 물품을 손괴한 사람에 대한 영상정보를 공권력인 경찰이 나서서 1차적으로 확인할 수 없는 상황이었다고 가정할 수 있다.
이는 공권력인 경찰과 국가기관인 보훈처가 상호협의 하에 사건 발생 직후 충분히 풀어낼 수 있는 문제였다는 점을 인식하고 가야 한다. 공적기관의 정상적이지 않은 활동을 염두에 두고 시스템을 개발한다는 것은, 그러한 기관들이 원활히 협조하고 잘 해결해 나갈 경우 시스템을 개발해도 실제 목적에 사용할 개연성이 그만큼 떨어진다는 것을 의미하기 때문이다.
둘째, 기술적인 측면에 있어서 현재 지능형 영상분석기술은 얼굴감지(Face Detection) 기능과 감지된 얼굴사진을 분석해 누구인지 파악하는 얼굴인식(Face Recognition) 솔루션으로 나눌 수 있다. 얼굴감지는 카메라 해상도에 따라 다르지만 2~20m 거리에서 지나가는 사람의 얼굴만을 감지해 저장하는 기능이고, 따로 인식은 하지 않는 기능이다.
그러므로 통행인의 얼굴 T존을 감지할 수 있는 충분한 픽셀의 영상 소스만 있다면 감지된 얼굴에 사각형 박스를 처리하든, 모자이크 처리를 하든 어려운 일은 아니다. 얼굴인식은 그렇게 감지된 얼굴을 저장된 데이터베이스에서 검색해서 누구인지 알려주는 것이다. 얼굴인식은 통상 30cm ~2m 내외의 인식 거리, D1급 카메라 내지 그 이상의 고해상도(Mega-Pixel) 카메라를 필요로 한다. 얼굴감지도 사람의 형체를 먼저 알아본 후 그 중에서 얼굴만을 추출해 내야 하므로 영상분석 서버의 CPU 소모가 많지만, 얼굴인식은 사전에 입력된 dBase와 비교를 해야 하기에 더 많은 시간이 소요되며 CPU 소모 역시 크다.
현재 5~10m 거리에서 군중 상황에서 D1급 카메라로 얼굴감지와 얼굴인식이 가능한 솔루션이 개발되어 있다. 사생활 보호를 위한 얼굴 모자이크 시스템을 적용한다면 30cm~2m 내외의 지근거리가 아닌 통상적인 카메라 설치 높이에서 얼굴감지가 가능한 시스템을 적용해야 할 것이다.
위의 사건에서 비록 CCTV 영상정보가 공개됐다 하더라도 몇 가지 어려움이 예상된다. 우선 물품 손괴 당시를 기록한 카메라가 충분한 해상도를 갖고 있지 않다면, 확대를 해도 누구인지 알기 어려울 수 있기 때문이다. 어떤 이가 손괴하는 큰 행위는 알 수 있을지 모르지만 구체적으로 누구인지는 알기는 어렵다는 것이다.
30만 화소급(640×480, VGA) 카메라라면 거리가 멀수록 인상착의 외의 구체적인 얼굴을 알기 힘들 것이다. 이보다 해상도가 낮다면 더 확인하기 힘들 것이다. 설령, 인상착의를 확인했다고 해도 1년 반이 지난 시점에서 국가보훈처나 주변에 있는 인근 CCTV 기록이 그 사람을 추적할 수 있도록 오래 저장되어 있을 수는 없을 것이다.
마지막으로 통행인에 대한 모자이크 처리 과정이다. 이는 개발을 통한 자동화와 현재 수동 시스템 중에 선택해야 한다. 위 사건의 경우는 CCTV 영상정보 공개를 통해 물품이 손괴당하는 그 행위가 발생한 것을 특정할 수 있을 경우, 몇몇 화면에 대해 캡처를 한 후 수동으로 손괴 행위와 관계없는 나머지 사람들을 모자이크 처리할 수 있을 것이다.
그러나 이러한 처리과정이 아닌 카메라를 통해 제공되는 영상에 대해 실시간 분석을 통해 얼굴을 감지하고, 감지된 얼굴에 대해 모자이크를 지속적으로 처리하는 것은 현재의 DVR이나 NVR 시스템에서 단순 저장만 하는 것에 비해 엄청난 컴퓨팅 파워를 요구하게 된다.
얼굴 모자이크 기술은 가능하지만 주변 여건조성 필요
전용 영상분석 시스템이라면, 1CIF 기준으로 서버 당 12~30채널도 한 번에 분석이 가능하지만, 예전 16채널 DVR 시스템에 당사의 지능형 영상분석 시스템을 탑재했을 경우 6fps의 분석임에도 불구하고 2-4 채널만 영상분석이 가능했었다.
왜냐하면 CPU 사용량이 많이 필요한 영상분석 시스템의 인체 모델 트래킹(Model Tracking)을 통해 얼굴감지를 하고 감지된 얼굴에 모자이크 처리를 해 저장을 자동화하며, 원본 데이터 필요 시 모자이크 패턴을 복호화 해 원본을 표시해 주는 것은 현재 기술 수준에서 가능해도 그만큼 많은 컴퓨터 하드웨어를 필요로 하기 때문이다.
더군다나 D1급 카메라나 고해상도 카메라를 사용해 얼굴감지나 얼굴인식을 수행할 경우엔 CIF급 분석에 비해 CPU 사용률이 5~10배 이상 증가하므로 하드웨어적 투자 부분에 대한 경제성 검토가 같이 필요하다.
그러므로 현행 DVR이나 NVR 시스템 내 지능형 영상분석 시스템을 일체화시켜 인체 모델 트래킹을 통한 얼굴 모자이크 처리를 하는 것은 하드웨어의 증가로 인해 무리수가 따른다. 이 경우는 영상을 부득이 공개해야만 하는, 모자이크 처리가 필요한 시점에 저장된 영상을 전용 얼굴 모자이크 처리 시스템을 가동시켜 일괄적으로 얼굴에 모자이크 처리를 하는 방법도 경제적일 대안일 수 있다.
최종적으로 정리를 하자면 솔루션마다 차이는 있겠지만 현행 개발 수준에서 얼굴 모자이크 처리 저장기술은 충분히 가능하다. 하지만 이를 법이나 시방서 등을 통해 일괄적으로 강제 적용하는 데에는 무리가 있다. 따라서 적용 시에는 현재의 NVR 등 저장매체의 하드웨어 성능과 지능형 영상분석 시스템의 하드웨어적 요구와 맞물려 검토되어야만 실제로 유효하게 사용될 수 있을 것이다.
<글 : 이 영 택 | iOmniscient Korea 대표(ytlee@crifas.co.kr)>
<저작권자: 보안뉴스(http://www.boannews.com/) 무단전재-재배포금지>