본문 바로가기

Basic Learning/Computer Vision

Scaled Representations : Image Pyramid

 

* 이 포스트는 컴퓨터 비젼에 대한 개인 학습용으로 작성한 포스트입니다.

 

 

Fourier Transform & Sampling

Continous time FT

 

 

Discrete time FT

 

 

Sampling

 

 

Nyquist theorem

Band-limited signal을 완전 복원하기 위해 다음 조건이 필요하다.

 

$f_B$를 signal의 maximum frequency, $f_S$를 sampling frequency라 할 때,

$f_S \geq 2f_B$를 만족하면 완전 복원이 가능하다.

 

위의 조건이 만족되지 않으면 aliasing이 발생한다.

 

 

 

Gaussian Pyramid

Aliasing 방지 : Sampling전에 low-pass filter를 통해 high frequency를 줄인다.

미리 gaussian blur를 하고 down-sampling을 한다. 이를 계속 반복하여 피라미드 형태를 만드는 것이 gaussian pyramid이다. 

 

 

 

 

아래 그림처럼 frequency 대역폭이 점점 작아진다. Level이 낮아질수록 (gaussian을 많이 취할 수록) low resolution을 가진다.

 

 

 

 

Image Interpolation

Image를 up-sampling (super-resolution)하기 위해서, interpolation하는 과정이 필요하다. 이는 Discrete data에 filter를 취하는 것과 같다. Nyquist thereom을 만족한다면 이상적인 filter는 sinc function이고 여러가지 상황에 따라 아래와 같은 다양한 함수가 쓰인다.

 

 

 

 

Laplacian Pyramid

Gaussian pyramid에서 gaussian pyramid level과 up-sampled gaussian pyramid level의 차이로 피라미드를 구성하는 방법. 하나의 level은 다른 level에서 가지고 있지 않는 특정 frequency 범위를 가진다.

이 방법으로 image를 쉽게 압축할 수 있고, 다양한 방법으로 응용될 수 있다.

 

 

 

 

 

 

'Basic Learning > Computer Vision' 카테고리의 다른 글

Fitting  (0) 2020.10.25
Rotation, Scale, Affine Invariant Features  (0) 2020.10.22
More Features  (0) 2020.10.08
Edges  (0) 2020.10.08
Linear Filters  (0) 2020.10.08