스케일에 불변한(scale-invariant) 특징을 찾는 데에 있다. [알고리즘 4-2]는 이러한 생각에 따라 스케일 불변한 특징을 찾는 큰 틀을 설명한다.
첫 번째 방식은 거리가 멀어지면 물체의 세밀한 내용은 사라지고 윤곽은 점점 흐릿해지는 원리를 이용한다. [그림 4-13(a)]는 \(σ\)를 점점 키워가며 가우시안 마스크로 스무딩 연산을 하여 이런 효과를 모방한다. 두 번째 방식은 [그림 4-13(b)]에서 보는 바와 같이 영상의 해상도를 반씩 줄여나감으로써 피라미드 영상을 구축한다.
[그림 4-14]는 표준편차(standard deviation) \(σ\)의 값을 점점 크게 하여 얻은 일련의 영상을 보여주는데, 이런 영상 집합을 다중 스케일 영상(multi-scale image) 이라고 부른다. 그림에서는 \(σ\)를 1.0씩 증가시켜 얻은 다중 스케일을 보여주는데, 스케일 불변 특징을 검출할 때는 보다 촘촘히 다중 스케일을 구성한다. 한편 이들이 구성하는 3차원 공간, 즉 (y,x,t)공간을 스케일 공간(scale space)이라 부른다. 스케일 공간에서는 분산(variance)을 나타내는 변수 \(t\)를 스케일 매개변수(scale parameter)라 부르며, \(t=σ^2\)이다.
스케일 공간에 있는 영상을 미분하여 얻은 도함수는 매우 유용한 정보를 제공하는데, \(n\)차까지의 도함수를 \(n\)-젯(n-jet)이라 부른다. 이들 도함수는 모두 회전에 공변(covariant)이다. 영상 내에서 물체가 회전하면 이들 값도 그에 따라 달라진다. 이들로부터 회전에 불변한 값들을 정의할 수 있다. 식 (4.16)의 세 가지 측정값은 모두 회전에 불변 이다. 영상 내에서 물체가 회전하더라도 이들 값은 변하지 않는다. \(\textcolor{Black}{ |∇f|=√(d_x^2+d_y^2 )\quad(그레이디언트 크기) }\) \(\textcolor{Black}{ ∇^2 f=d_yy+d_xx\quad(라플라시안)\quad(4.16) }\) \(\textcolor{Black}{ det(H)=d_yy d_xx−d_yx^2\quad(헤시안의 행렬값) }\)
[그림 4-15(a)] 왼쪽은 지름이 7, 오른쪽은 11인 원형블롭이다.
[그림 4-15(b)]는 다중 스케일 영상에 식 (4.17)의 정규 라플라시엔(normalized Laplacian)을 적용한 결과이다.
정규 라플라시안은 식 (4.16)의 라플라시안에 \(σ2\)을 곱한 식이다. 정규화를 하는 이유는 라플라시안을 구성하는 \(d_yy\) 와 \(d_xx\) 가 \(σ\)가 클수록 작아지기 때문이다. 이러한 현상을 보완하기위해 \(σ^2\)을 곱한다.
\(\textcolor{Black}{
∇_{norm^2} f=σ^2 |d_{yy} (σ)+d_{xx} (σ)|\quad(4.17)
}\)
[그림 4-15(c)]는 두 개 블롭의 중심에서 스케일 축(σ 값)에 따라 라플라시안 값의 변화를 보여준다.
출처 - Computer Vision