| 입력 영상에서 인원수의 공간적 분포 추정 기술 | 2015.03.08 | ||||
\r\n [시큐리티월드=나고야대학 다부치 요시무네·데구치 다이스케·이데 이치로·무라세 히로시/기후쇼토쿠가쿠엔대학] 카메라를 사용한 군집분석은 공공의 안전이나 마케팅 등에서 필요로 하고 있다. 이에 우리는 군집 분석 중에서도 소영역별 인원수를 구하는 공간적인 인원수 분포 추정 실현을 목표로 연구를 시작했다. \r\n
공공의 안전이나 마케팅을 목적으로 인원수를 세거나 행동조사와 같은 군집분석이 이루어지고 있다. 또 최근 보안의식의 고조로 CCTV로부터 얻은 대량의 영상에서 군집을 분석하는 기술이 요구되고 있다. 그러나 사람의 손으로 일일이 분석하면 많은 시간과 노동력이 필요하기 때문에 대량의 영상을 자동으로 군집분석하는 기술에 대해 기대가 높다. 우리는 군집분석 중에서도 카메라를 사용한 공간적인 인원수 분포 추정을 눈여겨 볼 생각이다. 이것은 그림 1과 같이 입력 영상에서 인원수의 공간적인 분포를 추정하는 기술이다. 이것으로 군집분포에 대한 상세한 정보를 얻을 수 있고 마케팅 등에도 이용할 수 있다. \r\n
지금까지 군집분석을 목적으로 인원수 추정이나 인물추적과 같은 다양한 연구가 이루어져 왔다. 카메라를 사용한 인원수 추정 연구로서 사람의 얼굴 등 특정한 형상을 검출해 수를 계산하는 방법1), 영상 특징량과 인원수의 관계 회귀에 근거하는 방법2), 영상속의 특정한 영역을 통과하는 사람을 검출해 인원수를 계산하는 방법3) 등이 제안됐다. 카메라로부터 공간적인 인원수 분포를 추정하는 것은 카메라로부터 떨어진 인물일수록 가까운 인물에 의해 가려지기 때문에 정확한 추정이 어려워진다는 문제점이 있다. 이번 기사에서 우리는 문헌7)에서 제안한 여러 대의 카메라 영상을 이용해 기억형 회귀로 인원수 분포를 추정하는 방법을 소개한다. 기억형 회귀는 그림 1에 나타난 것과 같이 군집의 모습과 인원수 분포의 대응표를 작성해 입력영상과 대응표를 비교하는 것으로 실현된다. 이미 군집의 모습에 겹치는 부분이 포함되어 있기 때문에 겹치는 문제에 대응할 수 있는 추정을 실현한다. 이와 비슷한 문제를 위쪽에 설치된 단일 CCTV로 해결하는 방법8)도 제안됐다. 그러나 위쪽에 카메라를 설치할 수 있는 현장은 그리 많지 않다. \r\n
기억형 회귀에 의한 인원수 분포 추정 \r\n기억형 회귀에 의한 인원수 분포 추정 방법은 바닥면을 여러 개의 영역으로 분할하고 각각의 분할된 영역에 존재하는 인원수를 추정하는 것으로 전체 인원수 분포를 구한다. 이제 분할 된 바닥면의 각 영역은 바닥면 분할영역이라고 하겠다. 이번 기사에서는 그림 3과 같이 바닥면을 3×3=9개의 영역으로 분할했다. 그림 4는 제안방법의 처리흐름을 나타낸 것이다. 제안방법은 학습영상 생성단계, 대응표 작성단계, 인원수 분포 추정단계의 3가지 처리로 흐름으로 나뉜다. 먼저 학습영상 생성단계에서는 학습용 영상을 영상합성으로 생성한다. 이번 기사에서 소개하는 방법은 여러 대의 카메라에 적용 가능하지만 좀 더 쉬운 설명을 위해 2대의 카메라일 경우를 가정하고 구체적인 처리 순서를 소개하겠다. 그 다음 각각의 처리에 대해서 상세하게 설명한다. \r\n(1) 학습영상 생성단계 \r\n그림 5는 학습영상 생성 처리의 흐름을 나타낸 것이다. \r\n① 각각의 바닥면 분할영역 내에 0∼4명이 존재하는 상황을 카메라로 사전에 촬영한다. ② 촬영된 영상으로부터 수작업으로 인물영역을 잘라낸다. \r\n
④ 이 처리를 양쪽 카메라에 모두 적용한다. \r\n(2) 대응표 작성단계 \r\n① 각 학습용 영상으로부터 특징량을 추출한다. 여기에서 특징 추출은 그림 7과 같이 바닥면 분할영역을 높이 방향으로 3분할한 영역에서 실시한다. 이것을 공간분할영역이라고 한다.
(3) 인원수 분포 추정단계 \r\n① 대응표 작성단계와 동일한 위치의 카메라 2대로부터 영상을 입력한다. \r\n
\r\n ③ 입력 특징 벡터와 대응표의 특징 벡터를 비교해 k 근방을 찾는다. 다른 인원수 분포 패턴에서도 특징량이 유사한 경우가 있기 때문에 여기에서는 최근방 대신에 k 근방을 사용한다. \r\n
인원수 분포 추정 실험 \r\n제안방법의 유효성을 조사하기 위해 인원수 분포 추정 실험을 실시했다. 그림 9는 카메라와 추정영역의 위치 관계를 나타낸 것이다. 이번 실험에서는 300×300㎠의 바닥면을 3×3=9개의 영역으로 분할해 인원수 분포를 추정했다. 비교방법은 각 분할된 영역 마다 인원수를 추정하는 것으로 인원수 분포를 추정하는 방법을 사용했다. 구체적으로 학습단계에서는 제안방법과 동일하게 추출한 특징량과 정답 인원수와의 관계를 2차 다항식으로 만들어 회귀하고 추정단계에서는 회귀로 얻은 2차 다항식을 이용해 바닥면 분할 영역별 인원수를 추정했다. \r\n
실험결과와 고찰 \r\n그림 11은 제안방법과 비교방법에 있어 각 바닥면 분할 영역의 추정 오차를 나타낸 것이다. 이 그림으로부터 모든 위치(x,y)에서 제안방법이 비교방법 보다 오차가 작다는 것을 알 수 있다. 비교방법에서는 사람들이 가려지는 현상 때문에 정확한 인원수 분포 추정이 어려웠을 것이다. 한편, 제안방법에서는 일부 사람이 가려지는 경우를 포함시켜 대응표를 작성했기 때문에 정밀도가 높게 나타났다고 생각된다. \r\n그림 12에 제안 방법이 정확하게 추정된 경우의 예를 제시한다. 그림 12 (a)에 바닥면 영역의 추정 인원수 절대값 오차를, 그림 12 (b)∼(e)에 카메라1과 카메라2의 입력 영상과 정답 배치 패턴의 생성 영상을 나타낸다. 이와 같이 입력 영상과 생성 영상의 모습이 유사하기 때문에 정밀도가 높아졌다고 생각할 수 있다. \r\n\r\n 한편, 그림 13에 제안 방법이 정확하게 추정하지 못한 경우의 예를 제시한다. 그림 13 (a)에 바닥면 영역의 추정 인원수 절대값 오차를 그림 13 (b)∼(e)에 카메라1과 카메라2의 입력영상과 정답배치 패턴의 생성 영상을 나타낸다. 그림 14에 제안 방법의 파라미터 k와 추정 오차의 관계를 나타낸다. 파라미터 k는 인원수 분포 추정단계의 k 근방값이다. 이 그림으로부터 k가 7 부근에서 가장 오차가 작다는 것을 알 수 있다. \r\n이번 기사에서는 다수의 카메라를 사용한 기억형 회귀로 공간적인 인원수 분포를 추정하는 방법7)을 소개했다. 이 방법은 먼저 여러 대의 카메라에 의해 얻은 영상을 공간분할 영역으로 나누고, 각 영역에서 특징량을 추출해 주성분 분석을 한다. [참고문헌] \r\n1) M.Li, Z.Zhang, K.Huang, T.Tan:“Estimating the number of people in crowded scenes by mid based foreground segmentation and head-shoulder detection”,Proc. 19th IAPR Int. Conf. on Pattern Recognition, WeAT2.1, pp.1-4(Dec.2008) \r\n2) A.Chan, Z.Liang, N.Vasconcelos:“Privacy preserving crowd monitoring:Counting people without people models or tracking”,Proc. 2008 IEEE Computer Society Conf. on Computer Vision and Pattern Recognition, pp.1-7(June 2008) \r\n3) K.Terada, D.Yoshida, S.Oe, J.Yamaguchi:“A method of counting the passing people by using the stereo images”,Proc. 1999 IEEE Int. Conf. on Image Processing, Vol.2, pp.338-342(Oct.1999) \r\n4) B.Wu, R.Nevatia:“Detection and tracking of multiple, partially occluded humans by Bayesian combination of edgelet based part detectors”,Int. Journal of Computer \r\nVision, Vol.75, No.2, pp.247-266(Nov.2007) \r\n5) O.Javed, Z.Rasheed, K.Shaque, M.Shah:“Tracking across multiple cameras with disjoint views”,Proc. 9th IEEE Int. Conf. on Computer Vision, Vol.2, pp.952-957(Oct.2003) \r\n6) O.Javed, K.Shaque, M.Shah:“Appearance modeling for tracking in multiple non-overlapping cameras”,Proc.2005 IEEE Computer Society Conf. on Computer Vision and Pattern Recognition, Vol.2, pp.26-33(June 2005) \r\n7) Y.Tabuchi, T.Takahashi, D.Deguchi, I.Ide, H.Murase, K.Kashino, T.Kurozumi : “Spatial people density estimation from multiple viewpoints by memory based regression”,Proc. 22nd IAPR Int. Conf. on Pattern Recognition. pp.2209-2214(Aug.2014) \r\n8) 니와카와마고토, 온다도시카즈 : “CCTV 영상 속 국소적인 움직임 검출과 이벤트 누적에 의한 시간적·공간적 혼잡도 조사”, 전기학회논문지, Vol. 124, No.10, pp.1060-1066(Oct. 2004) \r\n9) 나가야시게키, 미야타케다카후미, 후지타다케히로, 우에다히로타다, 이토게이이치 : “시간상관형 배경 판정법에 의한 이동물체 검출”, 전자정보통신학회논문지(D-II), Vol.J79-D-II, No. 4, pp.568-576(Apr. 1996) \r\n10) J.Canny : “A computational approach to edge detection”,IEEE Trans. on Pattern Analysis and Machine Intelligence, Vol.8, No.6, pp.679-698 (Nov.1986) \r\n[글_나고야대학 다부치 요시무네·데구치 다이스케·이데 이치로·무라세 히로시/기후쇼토쿠가쿠엔대학] \r\n[월간 시큐리티월드 통권 217호 (sw@infothe.com)] \r\n<저작권자 : (www.securityworldmag.co.kr) 무단전재-재배포금지> |
|||||
|
|