一般來說基于圖像處理的自動(dòng)對焦的方法有兩種,第一種是通過計(jì)算對焦深度得到的,第二種是通過計(jì)算離焦深度得到的。
這兩種方法的原理說明起來比較麻煩,簡單來說,離焦深度方法是從離焦圖像中獲得模糊程度和深度信息,根據(jù)二者加上對應(yīng)的拍攝參數(shù)來計(jì)算清晰度評價(jià)值,并結(jié)合這些所有值,得到需要調(diào)整的具體量,因?yàn)樾枰膱D像較少,所以速度較快。
對焦深度方法要麻煩一些,首先需要一系列模糊程度不同的圖像,計(jì)算這一系列圖像的清晰度評價(jià)值,之后對這一系列值以擬合的方式得到評價(jià)曲線,根據(jù)評價(jià)曲線的峰值確定最佳對焦位置,這種方法精度高,但速度慢。
需要說一點(diǎn)題外話就是,雖然這個(gè)些過程一樣,但不同的廠商的計(jì)算方法其實(shí)有些不同,所以一樣的對比度對焦,有的廠家就快,有的廠家就慢。
這兩種方法都不離開一個(gè)東西,就是清晰度評價(jià)值,清晰度評價(jià)值類似一個(gè)統(tǒng)計(jì)量,是根據(jù)一些參數(shù)經(jīng)過某種處理之后得到的,當(dāng)然清晰度評價(jià)值還有其他的要求,比如有效性/魯棒性等。
平常計(jì)算清晰度評價(jià)值的方法一般有這么幾種(不全面,還有其他的很多):
第一種是頻譜函數(shù)的方法,清晰的圖像對比相應(yīng)的不清晰圖像在相應(yīng)頻譜分量上含有更多的信息,一種反映出來就是頻譜函數(shù)的幅值,可以利用這種方法評價(jià)。
第二種是信息熵,清晰的圖像的信息熵大于相應(yīng)的不清晰圖像,這個(gè)原始證明很繁瑣,所以這里用數(shù)據(jù)處理定理反證:1.清晰的圖像處理后可以得到不清晰的圖像。 2.但不清晰的圖像無論如何處理都不能單獨(dú)得到清晰的圖像。 3.所以清晰圖像的信息熵大于相應(yīng)的不清晰圖像,如果有方法計(jì)算出信息熵,則可以用熵來評價(jià)。
第三種是梯度函數(shù),在圖像中梯度函數(shù)是一個(gè)可以衡量某變量變換率快慢的函數(shù),正確對焦的圖像有較為清晰的邊緣,而在邊緣的地方更為銳利,往往有變化率的最大值,或者說變化最不連續(xù),如此一來也可以評價(jià)清晰度。
現(xiàn)在常用的是第三種,也就是梯度,梯度在數(shù)學(xué)上是變換率的表征,在實(shí)際計(jì)算的時(shí)候我們可以用方差、能量梯度或者拉普拉斯算子(等價(jià)于二階微分)或者其他一些方法來實(shí)現(xiàn),這些計(jì)算方法本身各自的復(fù)雜度不同,但最影響計(jì)算量的是選取圖像中像素點(diǎn)的多寡,比如一個(gè)對比度對焦選款,是取中央一點(diǎn),還是邊緣四點(diǎn),還是對角線五點(diǎn)?這都是各個(gè)相機(jī)廠家考慮的問題。