演算法筆記 | 影像處理灰階
簡介圖片的特殊武器:Pyramid人眼有著觀(失焦、視野廣)看(對焦、視野窄)的差別。由觀到看、由看到觀的過程當中,人腦似乎能夠快速擷取圖片特點。一種模擬的方式是:圖片分別套用各種寬度的meanfilter。換句話說:圖片縮放成各種尺寸,套用相同寬度的meanfilter。meanpyramid[1]:圖片長寬屢次縮小一半,得到許多張圖片,形成金字塔。縮小時,每四個像素合併成一個像素(田變口),取平均值。此步驟即meanfilter,具有模糊化效果,彷彿人眼失焦。Gaussianpyramid[2]:縮小時改採Gaussianfilter,消滅邊緣。Laplacianpyramid[3]:縮...
簡介
圖片的特殊武器:Pyramid
人眼有著觀(失焦、視野廣)看(對焦、視野窄)的差別。由觀到看、由看到觀的過程當中,人腦似乎能夠快速擷取圖片特點。
一種模擬的方式是:圖片分別套用各種寬度的mean filter。換句話說:圖片縮放成各種尺寸,套用相同寬度的mean filter。
mean pyramid[1]:圖片長寬屢次縮小一半,得到許多張圖片,形成金字塔。縮小時,每四個像素合併成一個像素(田變口),取平均值。此步驟即mean filter,具有模糊化效果,彷彿人眼失焦。
Gaussian pyramid[2]:縮小時改採Gaussian filter,消滅邊緣。
Laplacian pyramid[3]:縮小時改採Laplacain filter,強調邊緣。
圖片的特殊武器:Blob
針對人類視覺系統的特性,擷取圖片引人注目的地方。
Laplacian of Gaussians (LoG)[4]:圖片套用各種寬度(變異數)的LoG filter。針對一種寬度,找到區域極大值,推定為圖片重點,重點的半徑範圍是LoG filter的變異數。
difference of Gaussians (DoG)[5]:LoG的高速近似算法。改為套用各種寬度的DoG filter。換句話說,圖片縮放成各種尺寸,套用同樣寬度的DoG filter。換句話說,Gaussian pyramid,從中選擇尺寸足夠大的圖片來縮小(因為放大會失真),以得到各種尺寸的圖片;寬度最接近的兩兩圖片,直接相減。【尚待確認:直接相減】
圖片的特殊武器:橢圓形Blob
引人注目的地方,莫名其妙是圓形。由於尺寸、形狀皆不夠精準,所以調整成橢圓形。不過還是很莫名其妙。
automatic scale selection:調整blob尺寸。一、找到一個blob之後,微調blob尺寸。二、計算blob裡面(或者周圍)所有像素的梯度的長度的平均值。三、平均值依照blob尺寸排列,形成一串數列。四、區域極大值所在之處,表示梯度變化最大,推定為正...