發(fā)布時間:2022-03-17所屬分類:計算機(jī)職稱論文瀏覽:1次
摘 要: 摘 要: 目的 工業(yè)產(chǎn)品的表面缺陷對產(chǎn)品的美觀度、舒適度和使用性能等帶來不良影響,所以生產(chǎn)企業(yè)對產(chǎn)品的表面缺陷進(jìn)行檢測以便及時發(fā)現(xiàn)并加以控制。機(jī)器視覺的檢測方法可以很大程度上克服人工檢測方法的抽檢率低、準(zhǔn)確性不高、實時性差、效率低、勞動強(qiáng)度大等弊端,在
摘 要: 目的 工業(yè)產(chǎn)品的表面缺陷對產(chǎn)品的美觀度、舒適度和使用性能等帶來不良影響,所以生產(chǎn)企業(yè)對產(chǎn)品的表面缺陷進(jìn)行檢測以便及時發(fā)現(xiàn)并加以控制。機(jī)器視覺的檢測方法可以很大程度上克服人工檢測方法的抽檢率低、準(zhǔn)確性不高、實時性差、效率低、勞動強(qiáng)度大等弊端,在現(xiàn)代工業(yè)中得到越來越廣泛的研究和應(yīng)用。方法 以機(jī)器視覺表面缺陷檢測為研究對象,在廣泛調(diào)研相關(guān)文獻(xiàn)和發(fā)展成果的基礎(chǔ)上,對基于機(jī)器視覺在表面缺陷檢測領(lǐng)域的應(yīng)用進(jìn)行了綜述。分析了典型機(jī)器視覺表面缺陷檢測系統(tǒng)的工作原理和基本結(jié)構(gòu),闡述了表面缺陷視覺檢測的研究現(xiàn)狀、現(xiàn)有視覺軟件和硬件平臺,綜述了機(jī)器視覺檢測所涉及到的圖像預(yù)處理算法、圖像分割算法、圖像特征提取及其選擇算法、圖像識別等相關(guān)理論和算法研究,并對每種主要方法的基本思想、特點和存在的局限性進(jìn)行了總結(jié),對未來可能的發(fā)展方向進(jìn)行展望。結(jié)果 機(jī)器視覺表面缺陷檢測系統(tǒng)中,圖像處理和分析算法是重要內(nèi)容,算法各有優(yōu)缺點和其適應(yīng)范圍。如何提高算法的準(zhǔn)確性、實時性和魯棒性,一直是研究者們努力的方向。結(jié)論機(jī)器視覺是對人類視覺的模擬,機(jī)器視覺表面檢測涉及眾多學(xué)科和理論,如何使檢測進(jìn)一步向自動化和智能化方向發(fā)展,還需要更深入的研究。
關(guān)鍵詞: 機(jī)器視覺; 表面缺陷; 檢測算法; 圖像處理; 圖像識別
0 引 言
中國是一個制造大國,每天都要生產(chǎn)大量的工業(yè)產(chǎn)品。用戶和生產(chǎn)企業(yè)對產(chǎn)品質(zhì)量的要求越來越高,除要求滿足使用性能外,還要有良好的外觀,即良好的表面質(zhì)量。但是,在制造產(chǎn)品的過程中,表面缺陷的產(chǎn)生往往是不可避免的。不同產(chǎn)品的表面缺陷有著不同的定義和類型,一般而言表面缺陷是產(chǎn)品表面局部物理或化學(xué)性質(zhì)不均勻的區(qū)域,如金屬表面的劃痕、斑點、孔洞,紙張表面的色差、壓痕,玻璃等非金屬表面的夾雜、破損、污點,等等。表面缺陷不僅影響產(chǎn)品的美觀和舒適度,而且一般也會對其使用性能帶來不良影響,所以生產(chǎn)企業(yè)對產(chǎn)品的表面缺陷檢測非常重視,以便及時發(fā)現(xiàn),從而有效控制產(chǎn)品質(zhì)量,還可以根據(jù)檢測結(jié)果分析生產(chǎn)工藝中存在的某些問題,從而杜絕或減少缺陷品的產(chǎn)生,同時防止?jié)撛诘馁Q(mào)易糾份,維護(hù)企業(yè)榮譽(yù)。
人工檢測是產(chǎn)品表面缺陷的傳統(tǒng)檢測方法,該方法抽檢率低、準(zhǔn)確性不高、實時性差、效率低、勞動強(qiáng)度大、受人工經(jīng)驗和主觀因素的影響大,而基于機(jī)器視覺的檢測方法可以很大程度上克服上述弊端。
美國機(jī)器人工業(yè)協(xié)會( RIA) 對機(jī)器視覺下的定義為: “機(jī)器視覺是通過光學(xué)的裝置和非接觸的傳感器自動地接收和處理一個真實物體的圖像,以獲得所需信息或用于控制機(jī)器人運動的裝置”[1]。
機(jī)器視覺是一種無接觸、無損傷的自動檢測技術(shù),是實現(xiàn)設(shè)備自動化、智能化和精密控制的有效手段,具有安全可靠、光譜響應(yīng)范圍寬、可在惡劣環(huán)境下長時間工作和生產(chǎn)效率高等突出優(yōu)點。機(jī)器視覺檢測系統(tǒng)通過適當(dāng)?shù)墓庠春蛨D像傳感器( CCD 攝像機(jī)) 獲取產(chǎn)品的表面圖像,利用相應(yīng)的圖像處理算法提取圖像的特征信息,然后根據(jù)特征信息進(jìn)行表面缺陷的定位、識別、分級等判別和統(tǒng)計、存儲、查詢等操作。
視覺表面缺陷檢測系統(tǒng)基本組成主要包括圖像獲取模塊、圖像處理模塊、圖像分析模塊、數(shù)據(jù)管理及人機(jī)接口模塊。
圖像獲取模塊由 CCD 攝像機(jī)、光學(xué)鏡頭、光源及其夾持裝置等組成,其功能是完成產(chǎn)品表面圖像的采集。在光源的照明下,通過光學(xué)鏡頭將產(chǎn)品表面成像于相機(jī)傳感器上,光信號先轉(zhuǎn)換成電信號,進(jìn)而轉(zhuǎn)換成計算機(jī)能處理的數(shù)字信號。目前工業(yè)用相機(jī)主要基于 CCD 或 CMOS( complementary metal oxide semiconductor) 芯片的相機(jī)。CCD 是目前機(jī)器視覺最為常用的圖像傳感器。
光源直接影響到圖像的質(zhì)量,其作用是克服環(huán)境光干擾,保證圖像的穩(wěn)定性,獲得對比度盡可能高的圖像。目前常用的光源有鹵素?zé)簟晒鉄艉桶l(fā)光二級管( LED) 。LED 光源以體積小、功耗低、響應(yīng)速度快、發(fā)光單色性好、可靠性高、光均勻穩(wěn)定、易集成等優(yōu)點獲得了廣泛的應(yīng)用。
由光源構(gòu)成的照明系統(tǒng)按其照射方法可分為明場照明與暗場照明、結(jié)構(gòu)光照明與頻閃光照明。明場與暗場主要描述相機(jī)與光源的位置關(guān)系,明場照明指相機(jī)直接接收光源在目標(biāo)上的反射光,一般相機(jī)與光源異側(cè)分布,這種方式便于安裝; 暗場照明指相機(jī)間接接收光源在目標(biāo)上的散射光,一般相機(jī)與光源同側(cè)分布,它的優(yōu)點是能獲得高對比度的圖像。結(jié)構(gòu)光照明是將光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變,解調(diào)出被測物的 3 維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機(jī)拍攝要求與光源同步。
圖像處理模塊主要涉及圖像去噪、圖像增強(qiáng)與復(fù)原、缺陷的檢測和目標(biāo)分割。
由于現(xiàn)場環(huán)境、CCD 圖像光電轉(zhuǎn)換、傳輸電路及電子元件都會使圖像產(chǎn)生噪聲,這些噪聲降低了圖像的質(zhì)量從而對圖像的處理和分析帶來不良影響,所以要對圖像進(jìn)行預(yù)處理以去噪。圖像增強(qiáng)目是針對給定圖像的應(yīng)用場合,有目的地強(qiáng)調(diào)圖像的整體或局部特性,將原來不清晰的圖像變得清晰或強(qiáng)調(diào)某些感興趣的特征,擴(kuò)大圖像中不同物體特征之間的差別,抑制不感興趣的特征,使之改善圖像質(zhì)量、豐富信息量,加強(qiáng)圖像判讀和識別效果的圖像處理方法。圖像復(fù)原是通過計算機(jī)處理,對質(zhì)量下降的圖像加以重建或復(fù)原的處理過程。圖像復(fù)原很多時候采用與圖像增強(qiáng)同樣的方法,但圖像增強(qiáng)的結(jié)果還需要下一階段來驗證; 而圖像復(fù)原試圖利用退化過程的先驗知識,來恢復(fù)已被退化圖像的本來面目,如加性噪聲的消除、運動模糊的復(fù)原等。圖像分割的目的是把圖像中目標(biāo)區(qū)域分割出來,以便進(jìn)行下一步的處理。
圖像分析模塊主要涉及特征提取、特征選擇和圖像識別。
特征提取的作用是從圖像像素中提取可以描述目標(biāo)特性的表達(dá)量,把不同目標(biāo)間的差異映射到低維的特征空間,從而有利于壓縮數(shù)據(jù)量、提高識別率。表面缺陷檢測通常提取的特征有紋理特征、幾何形狀特征、顏色特征、變換系數(shù)特征等,用這些多信息融合的特征向量來區(qū)可靠地區(qū)分不同類型的缺陷; 這些特征之間一般存在冗余信息,即并不能保證特征集是最優(yōu)的,好的特征集應(yīng)具備簡約性和魯棒性,為此,還需要進(jìn)一步從特征集中選擇更有利于分類的特征,即特征的選擇。圖像識別主要根據(jù)提取的特征集來訓(xùn)練分類器,使其對表面缺陷類型進(jìn)行正確的分類識別。
數(shù)據(jù)管理及人機(jī)接口模塊可在顯示器上立即顯示缺陷類型、位置、形狀、大小,對圖像進(jìn)行存儲、查詢、統(tǒng)計等。
機(jī)器視覺表面缺陷檢測主要包括 2 維檢測和 3 維檢測,前者是當(dāng)前的主要表面缺陷檢測方式,也是本文的著重論述之處。
機(jī)器視覺在工業(yè)檢測、包裝印刷、食品工業(yè)、航空航天、生物醫(yī)學(xué)工程、軍事科技、智能交通、文字識別等領(lǐng)域得到了廣泛的應(yīng)用。工業(yè)檢測領(lǐng)域是機(jī)器視覺應(yīng)用中比重最大的領(lǐng)域,主要用于產(chǎn)品質(zhì)量檢測、產(chǎn)品分類、產(chǎn)品包裝等,如: 零件裝配完整性檢測,裝配尺寸精度檢測,位置/角度測量,零件識別, PCB 板檢測,印刷品檢測,瓶蓋檢測,玻璃、煙草、棉花檢測,以及指紋、汽車牌照、人臉、條碼等識別。表面質(zhì)量檢測系統(tǒng)是工業(yè)檢測的極其重要的組成部分,機(jī)器視覺表面缺陷檢測在許多行業(yè)開始應(yīng)用,涉及鋼板[2-4]、玻璃[5-6]、印刷[7-9]、電子[10]、紡織品[11]、零件[12-13]、水果[14]、木材[15-16]、瓷磚[17-19]、鋼軌[20]等多種關(guān)系國計民生的行業(yè)和產(chǎn)品。
1 研 究 現(xiàn) 狀、視覺軟件系統(tǒng)和研究平臺
1. 1 研究現(xiàn)狀
機(jī)器視覺在金屬( 特別是鋼板) 表面、紙張等印刷品、紡織品、磁磚、玻璃、木材等表面缺陷檢測國內(nèi)外有較多的研究成果,不乏成功應(yīng)用系統(tǒng)和案例。
在鋼板表面缺陷檢測領(lǐng)域,美國 Westinghouse 公司采用線陣 CCD 攝像機(jī)和高強(qiáng)度的線光源檢測鋼板表面缺陷,并提出了將明域、暗域及微光域 3 種照明光路形式組合應(yīng)用于檢測系統(tǒng)的思路[21]。這些系統(tǒng)可識別的缺陷種類相對較少,并且不具備對周期性缺陷的識別能力。美國 Cognex 公司研制成功了 iS - 2000 自動檢測系統(tǒng)和 iLearn 自學(xué)習(xí)分類器軟件系統(tǒng)[22]。這兩套系統(tǒng)配合有效改善了傳統(tǒng)自學(xué)習(xí)分類方法在算法執(zhí)行速度、數(shù)據(jù)實時吞吐量、樣本訓(xùn)練集規(guī)模及模式特征自動選擇等方面的不足; Parsytec 公司為韓國浦項制鐵公司研制了冷軋鋼板表面缺陷檢測系統(tǒng) HTS,該系統(tǒng)能對高速運動的熱軋鋼板表面缺陷進(jìn)行在線自動檢測和分級的系統(tǒng),在連 軋 機(jī) 和 CSP 生產(chǎn)線上取得了良好的效果[23]; 英國 European Electronic System 公司研制的 EES 系統(tǒng)也成功地應(yīng)用于熱連軋環(huán)境下的鋼板質(zhì)量自動檢測[24]。EES 系統(tǒng)實時地提供高清晰度、高可靠性的鋼板上下表面的缺陷圖像,最終交由操作員進(jìn)行缺陷類型的分類判別。國內(nèi)北京科技大學(xué)的高效軋制國家工程研究中心也在進(jìn)行鋼板表面質(zhì)量檢測系統(tǒng)的研制,對其常見缺陷類型進(jìn)行了檢測與識別,取得了一定的研究成果[25],東北大學(xué)、上海寶鋼集團(tuán)公司、武漢科技大學(xué)等科研院所研究了冷軋鋼板表面缺陷的檢測系統(tǒng)[26-28],重慶大學(xué)對高溫連鑄坯表面缺陷進(jìn)行了研究[29]。
在其他領(lǐng)域,視覺表面缺陷檢測也得到了廣泛的研究和應(yīng)用。文獻(xiàn)[30]對規(guī)則紋理表面( 天然木材、機(jī)械加工表面、紡織面料) 的表面缺陷采用傅里葉變換進(jìn)行圖像的復(fù)原,高頻的傅里葉分量對應(yīng)表面紋理線型,而低頻的傅里葉分量對應(yīng)表面缺陷區(qū)域。文獻(xiàn)[31]研究了鋁帶連鑄生產(chǎn)中的表面缺陷檢測,通過紅外檢測提供鋁帶表面溫度的分布情況以評估鋁帶質(zhì)量,采集鋁帶圖像,進(jìn)行表面缺陷檢測和分類。文獻(xiàn)[32]將機(jī)器視覺應(yīng)用于集成電路晶片表面缺陷檢測,使用模糊邏輯對表面凹坑缺陷的不同形狀進(jìn)行分析處理。文獻(xiàn)[33]利用圖像對鐵軌的表面質(zhì)量進(jìn)行自動檢測,車載檢測系統(tǒng)對鐵軌的表面質(zhì)量進(jìn)行實時檢測和分類。文獻(xiàn)[34]基于機(jī)器視覺系統(tǒng)對雞肉包裝前的質(zhì)量檢測,根據(jù)雞肉圖像的顏色信息,采用數(shù)學(xué)形態(tài)學(xué)方法對潛在的問題區(qū)域進(jìn)行特征提取,然后按預(yù)定義的質(zhì)量問題列表進(jìn)行分類。文獻(xiàn)[35]針對隨機(jī)紋理的彩色圖像提出了一種利于分水嶺變換的顏色相似性度量,提取了圖像的顏色和紋理特征,實現(xiàn)了隨機(jī)紋理表面缺陷的自動分割和檢測。文獻(xiàn)[36]采用雙目立體視覺,基于特征立體匹配算法對掃描電鏡圖像研究了物體的表面深度信息。文獻(xiàn)[37]介紹了一種皮革表面缺陷檢測的方法,采用 OTSU 方法進(jìn)行缺陷分割,利用歐式距離聚類法進(jìn)行缺陷分類,在分類聚類時使用形態(tài)學(xué)算子進(jìn)行腐蝕運算,實驗結(jié)果表明了該方法的有效性。文獻(xiàn)[38]對玻璃缺陷進(jìn)行了識別,把采集到的缺陷圖像縮放到 10 × 10 的大小,然后把這個 100 個像素值作為特征向量,分別運用徑向基( RBF) 神經(jīng)網(wǎng)絡(luò)和決策樹進(jìn)行識別; 該方法的缺點是不同缺陷縮放后造成部分信息的丟失。文獻(xiàn)[39]研究了一種玻璃缺陷識別的專家系統(tǒng)( ES) ,首先需要電子顯微技術(shù)和等離子射線獲得缺陷信息作為知識庫,對未知的玻璃缺陷通過搜索知識庫對缺陷信息進(jìn)行匹配,選擇最相近的類別作為輸出; 該方法的缺點是分類采用貪婪搜索法,匹配速度慢。文獻(xiàn)[40]針對機(jī)器視覺在產(chǎn)品表面粗糙度的檢測方法作了描述,首先建立粗糙度的模型,然后以表面的累加偏差作為特征通過神經(jīng)網(wǎng)絡(luò)( ANN) 進(jìn)行等級劃分,并闡述了不同的 ANN 模型對識別結(jié)果的影響。
1. 2 視覺軟件系統(tǒng)
機(jī)器視覺軟件系統(tǒng)除具有圖像處理和分析功能外,還應(yīng)具有界面友好、操作簡單、擴(kuò)展性好、與圖像處理專用硬件兼容等優(yōu)點。國外視覺檢測技術(shù)研究開展的較早,已涌現(xiàn)了許多較為成熟的商業(yè)化軟件,應(yīng)該 比 較 多 的 有 HALCON、HexSight、Vision Pro、 LEADTOOLS 等[41]。
HALCON 是德國 MVtec 公司開發(fā)的一套完善的標(biāo)準(zhǔn)的機(jī)器視覺算法包,擁有應(yīng)用廣泛的機(jī)器視覺集成開發(fā)環(huán)境維視圖像開發(fā)定制軟件,在歐洲以及日本的工業(yè)界已經(jīng)是公認(rèn)具有最佳效能的 Machine Vision 軟件。HALCON 的 image processing library,由一千多個各自獨立的函數(shù)和底層的數(shù)據(jù)管理核心構(gòu)成,其函數(shù)庫可以用 C,C + + ,C#,Visual basic 和 Delphi 等多種普通編程語言訪問。HALCON 百余種工業(yè)相機(jī)和圖像采集卡提供接口,包括 GenlCam,GigE 和 IIDC 1394。HALCO 還具有強(qiáng)大的 3 維視覺處理能力,另 外,自動算子并行處 理 ( AOP) 技術(shù)是 HALCON 的一個獨特性能。HALCON 應(yīng)用范圍涵蓋自動化檢測、醫(yī)學(xué)和生命科學(xué),遙感探測,通訊和監(jiān)控等眾多領(lǐng)域。
Adept 公司出品的 HexSight 是一款高性能的、綜合性的視覺軟件開發(fā)包,它提供了穩(wěn)定、可靠及準(zhǔn)確定位和檢測零件的機(jī)器視覺底層函數(shù)。HexSight 的定位工具是根據(jù)幾何特征、采用輪廓檢測技術(shù)來識別對象和模式。在圖像凌亂、亮度波動、圖像模糊和對象重疊等方面有顯著效果。HexSight 能處理自由形 狀 的 對 象,并具有功能強(qiáng)大的去模糊算法。 HexSight 軟件包含一個完整的底層機(jī)器視覺函數(shù)庫,可用來建構(gòu)完整的高性能 2D 機(jī)器視覺系統(tǒng),可利用 Visual Basic、Visual C + + 或 Borland Dephi 平臺方便地進(jìn)行二次開發(fā)。其運算速度快,在一臺 2 GHz 的處理器上尋找和定位一般的零部件不超過 10 ms; 具有 1 /40 亞像素平移重復(fù)精度和 0. 05 度旋轉(zhuǎn)重復(fù)精度。此外,內(nèi)置的標(biāo)定模塊能矯正畸變、投影誤差和 X - Y 像素比誤差,完整的檢測工具包含硬件接口、圖像采集、圖像標(biāo)定、圖像預(yù)處理、幾何定位、顏色檢測、幾何測量、Blob 分析、清晰度評價( 自動對焦) 、模式匹配、邊緣探測等多種多樣,開放式體系結(jié)構(gòu),支持 DirectShow、DCam,GigE vision 等多種通用協(xié)議,幾乎與市面上所有商業(yè)圖像采集卡,以及各種 USB、1394 以及 GigE 接口的攝像機(jī)兼容。
Cognex 公司的 VisionPro 是一套基于. Net 的視覺工具,適用于包括 FireWire 和 CameraLink 在內(nèi)的所有硬件平臺,利用 ActiveX 控制可快速完成視覺應(yīng)用項目程序的原模型開發(fā),可使用相應(yīng)的 Visual Basic、VB. Net、C#或 C + + 搭建出更具個性化的應(yīng)用程序。
LEADTOOLS 在數(shù)碼圖像開發(fā)工具領(lǐng)域中已成為全球領(lǐng)導(dǎo)者之一,是目前功能強(qiáng)大的優(yōu)秀的圖形、圖像處理開發(fā)包,它可以處理各種格式的文件,并包含所有圖形、圖像的處理和轉(zhuǎn)換功能,支持圖形、圖像、多媒體、條形碼、OCR、Internet、DICOM 等等,具有各種軟硬件平臺下的開發(fā)包。
此外,還有 Dalsa 公司的 Sherlock 檢測軟件,日本的 OMRON 和 Keyence,德國 SIEMENS 等,這些機(jī)器視覺軟件都能提供完整的表面缺陷檢測方法。
國內(nèi)機(jī)器視覺檢測系統(tǒng)開發(fā)較晚,相關(guān)的企業(yè)主要是代理國外同類產(chǎn)品,提供視覺檢測方案和系統(tǒng)集成,其中具有代表性的企業(yè)有凌華科技、大恒圖像、視覺龍、凌云光子、康視達(dá)、OPT、三姆森和微視圖像等。
1. 3 視覺硬件平臺
機(jī)器視覺表面質(zhì)量檢測,特別是實時檢測,圖像采集的數(shù)據(jù)量大,所以如何提高圖像處理速度顯得十分重要。提高圖像處理速度主要有兩種手段,一是改善和優(yōu)化圖像處理算法,算法既要簡單快速,又要兼顧實際效果; 二是改善和優(yōu)化實現(xiàn)算法的手段。目前,實時圖像處理采集方案主要為下面幾個方面[42]。
1) 通用計算機(jī)網(wǎng)絡(luò)并行處理。這種處理結(jié)構(gòu)采用“多客戶機(jī) + 服務(wù)器”的方式,一個圖像傳感器對應(yīng)一臺客戶機(jī),服務(wù)器實現(xiàn)信息的合成,圖像處理的大部分工作由軟件來完成。該結(jié)構(gòu)雖然比較龐大,但升級維護(hù)方便、實時性較好。
2) 數(shù)字信號處理器( DSP) 。DSP 是一種獨特的微處理器,是以數(shù)字信號來處理大量信息的器件。其工作原理是將接收到的模擬信號轉(zhuǎn)換為“0”或 “1”的數(shù)字信號,再對數(shù)字信號進(jìn)行修改、刪除和強(qiáng)化,并在其他系統(tǒng)芯片中把數(shù)字?jǐn)?shù)據(jù)解譯回模擬數(shù)據(jù)或?qū)嶋H環(huán)境格式,其實時運行速度遠(yuǎn)遠(yuǎn)超過通用微處理器。但是,DSP 的體系仍是串行指令執(zhí)行系統(tǒng),而且只是對某些固定的運算進(jìn)行硬件優(yōu)化,故不能滿足眾多的算法要求。
3) 專用集成電路( ASIC) 。ASIC 是針對于某一固定算法或應(yīng)用而專門設(shè)計的硬件芯片,有很強(qiáng)的實時性。但在實際應(yīng)用中存在開發(fā)周期相對較長、成本高、適應(yīng)性和靈活性差等缺點。
4) 現(xiàn)場可編程門陣列( FPGA) 。FPGA 由多個可編程的基本邏輯單元組成的一個 2 維矩陣,邏輯單元之間以及邏輯單元與 I/O 單元之間通過可編程連線進(jìn)行連接。FPGA 能在設(shè)計上具有很強(qiáng)的靈活性,集成度、工作速度也在不斷提高,可實現(xiàn)的功能也越來越強(qiáng); 同時其開發(fā)周期短,系統(tǒng)易于維護(hù)和擴(kuò)展,能夠大大地提高圖像數(shù)據(jù)的處理速度。
實時圖像處理系統(tǒng)中,底層的信號數(shù)據(jù)量大,對處理速度的要求高,但運算結(jié)構(gòu)相對比較簡單,適合采用 FPGA 以硬件方式來實現(xiàn); 高層處理算法的特點是處理的數(shù)據(jù)量相對較少,但算法和控制結(jié)構(gòu)復(fù)雜,可使用 DSP 來實現(xiàn)。所以,可以把二者的優(yōu)點結(jié)合在一起以兼顧實時性和靈活性。
USB、串口、并口是計算機(jī)和外設(shè)進(jìn)行通訊的常用接口,但對于數(shù)據(jù)量大的圖像來說,串行 RS - 232 協(xié)議難于達(dá)到圖像采集實時性要求。USB 口即使能滿足所需速度,但要求外設(shè)必須支持 USB 協(xié)議,而 USB 協(xié)議與常用工程軟件的接口還不普及。 IEEE - 1394 接口具有廉價,速度快,支持熱拔插,數(shù)據(jù)傳輸速率可擴(kuò)展,標(biāo)準(zhǔn)開放等特點,在眾多領(lǐng)域得到了廣泛的應(yīng)用。但隨著數(shù)字圖像采集速度的提高、數(shù)據(jù)量的增大,原有的標(biāo)準(zhǔn)漸難以滿足需求。為了簡化數(shù)據(jù)的連接,實現(xiàn)高速、高精度、靈活、簡單的連接,在 National Semiconductor 公司等多家相機(jī)制造商共同制定推出了 Camera Link 標(biāo) 準(zhǔn)。Camera Link 是專門為數(shù)字?jǐn)z像機(jī)的數(shù)據(jù)傳輸提出的接口標(biāo)準(zhǔn),專為數(shù)字相機(jī)制定的一種圖像數(shù)據(jù)、視頻數(shù)據(jù)控制信號及相機(jī)控制信號傳輸?shù)目偩接口,其最主要特點是采用了低壓差分信號 ( LVDS) 技術(shù),使攝像機(jī)的數(shù)據(jù)傳輸速率大大提高。
2 表面缺陷檢測圖像處理和分析算法
2. 1 圖像預(yù)處理算法
工業(yè)現(xiàn)場采集的圖像通常包含噪聲,圖像預(yù)處理主要目的是減少噪聲,改善圖像的質(zhì)量,使之更適合人眼的觀察或機(jī)器的處理。圖像的預(yù)處理通常包括空域方法和頻域方法,其算法有灰度變換、直方圖均衡、基于空域和頻域的各種濾波算法等,其中直觀的方法是根據(jù)噪聲能量一般集中于高頻,而圖像頻譜則分布于一個有限區(qū)間的這一特點,采用低通濾波方式進(jìn)行去噪,例如滑動平均窗濾波器、Wiener 線性濾噪器等。上述各種濾波方法中,頻域變換復(fù)雜,運算代價較高; 空域濾波算法采用各種模板對圖像進(jìn)行卷積運算。直接灰度變換法通過對圖像每一個像素按照某種函數(shù)進(jìn)行變換后得到增強(qiáng)圖像,變換函數(shù)一般多采用線性函數(shù)、分段線性函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等,運算簡單,在滿足處理功能的前提下實時性也較高。近年來,數(shù)學(xué)形態(tài)學(xué)方法[43-44]、小波 方 法[45-47] 用于圖像的去噪,取 得 了 較 好 的效果。
2. 2 圖像分割算法
圖像的分割是把圖像陣列分解成若干個互不交迭的區(qū)域,每一個區(qū)域內(nèi)部的某種特性或特征相同或接近,而不同區(qū)域間的圖像特征則有明顯差別。它是由圖像處理到圖像分析的關(guān)鍵步驟。現(xiàn)有的圖像分割方法主要分為基于閾值的分割方法、基于區(qū)域的分割方法、基于邊緣的分割方法以及基于特定理論的分割方法等。近年來,研究者不斷改進(jìn)原有的圖像分割方法并把其他學(xué)科的一些新理論和新方法用于圖像分割,提出了不少新的分割方法。圖像分割后提取出的目標(biāo)可以用于圖像語義識別、圖像搜索等領(lǐng)域。
2. 2. 1 基于區(qū)域的分割算法
基于區(qū)域的分割算法包括閾值分割法、區(qū)域生長法和聚類分割法等。
閾值分割法是一種傳統(tǒng)的圖像分割方法,其基本原理是: 通過設(shè)定不同的灰度閾值,把圖像像素點分為若干類。因其實現(xiàn)簡單、計算量小、性能較穩(wěn)定而成為圖像分割中最基本和應(yīng)用最廣泛的分割方法,其中閾值的選取是圖像閾值分割方法中的關(guān)鍵。
關(guān)于閾值的確定方法,目前比較常用的有固定閾值法、自適應(yīng)閾值法、多區(qū)域閾值法等。固定閾值分割算法實時性強(qiáng),適用于圖像背景和目標(biāo)灰度值區(qū)別明顯的情況; 自適應(yīng)閾值分割算法,適用于目標(biāo)與背景的灰度值區(qū)別不明顯的情況; 多區(qū)域閾值法,適用于目標(biāo)與背景在不同區(qū)域區(qū)別較大的情況。
Otsu 提出了動態(tài)門限方法[48],它以目標(biāo)和背景之間的方差最大來動態(tài)地確定圖像分割門限值,但當(dāng)目標(biāo)的相對面積較小時,此方法性能不佳。Pun 和 Kapur 等人提出了利用最大先驗熵選取閾值的方法[49-50],從信息論的角度選擇閾值,在一定程度上克服了上述算法的缺點,但當(dāng)圖像背景復(fù)雜時分割時容易喪失部分信息,且計算量較大。
Yen 等人提出了利用最大相關(guān)性原則取代常用的最大熵原則來選取閾值的方法[51],以及基于一維或 2 維直方圖的閾值方法[52-54]、最小誤判概率準(zhǔn)則下的最佳閾值方法[55]在其后也被提出。
區(qū)域生長法的基本思想是依據(jù)一定的生長準(zhǔn)則,將若干個“相似”子區(qū)域聚合成較大的區(qū)域。它首先對每個需要分割的區(qū)域找到一個種子像素作為生長的起點,再將種子像素鄰域中與其具有相同或相似性質(zhì)的像素根據(jù)某種事先確定的準(zhǔn)則合并到種子像素所在的區(qū)域中; 將這些新像素當(dāng)作新的種子像素繼續(xù)像上面的操作,直到再沒有滿足條件的像素可包括進(jìn)來。此法原理簡單,對于較均勻的連通目標(biāo)有較好的分割效果; 缺點是依賴于初始條件的選取,計算量較大,不適用于實時檢測。
分裂—合并法也是一種基于區(qū)域的分割算法,其基本思想是: 根據(jù)圖像和各區(qū)域的不均勻性,將圖像或區(qū)域分裂成新的子區(qū)域,再將包含相同內(nèi)容的區(qū)域合并成新的較大區(qū)域,最后得到分割圖像。四叉樹分解是一種常用的分裂—合并法,其具體過程是: 將圖像分成 4 塊大小相等的方塊,判斷每個小塊是否滿足一致性標(biāo)準(zhǔn)( 如兩區(qū)域參數(shù)統(tǒng)計特征結(jié)果相同,等等) 。若滿足,則不再分解; 若不滿足,則再細(xì)分成四塊,再用細(xì)分塊進(jìn)行一致性標(biāo)準(zhǔn)檢查,直到滿足一致性標(biāo)準(zhǔn),結(jié)果可能包含大小不同的塊。
聚類法進(jìn)行圖像分割是根據(jù)圖像在特征空間的聚集對特征空間進(jìn)行分割,再映射到原圖像空間得到分割結(jié)果,K 均 值 聚 類 算 法、模 糊 C 均 值 聚 類 ( FCM) 算法[56 - 57]是常用的聚類算法。
2. 2. 2 基于邊緣的分割方法
基于邊緣的分割方法其實就是根據(jù)圖像中局部特性的不連續(xù)性而采用某種算法來提取出圖像中的對象與背景間的交界線。
相關(guān)知識推薦:論文發(fā)表sci期刊需要多久
邊緣處像素的灰度值不連續(xù),這種不連續(xù)性可通過求導(dǎo)來檢測。經(jīng)典的邊緣檢測算法一般采用微分的方法進(jìn)行計算,常用的一階微分邊緣檢測算子有 Robert 算子、Sobel 算子、Prewitt 算子、Kirsch 算子等幾種。一階微分算子方法計算簡便、速度快,但定位不準(zhǔn)確。二階微分算子主要有 Canny 算子、Log 算子、Laplacian 算子,這類算子基于一階導(dǎo)數(shù)的局部最大值對應(yīng)二階導(dǎo)數(shù)的零交叉點這一性質(zhì),通過尋找圖像灰度的二階導(dǎo)數(shù)的零交叉點從而定位邊緣。二階微分算子方法邊緣定位準(zhǔn)確,但對噪聲敏感。對于噪聲污染的圖像,在進(jìn)行微分算子邊緣檢測前一般先要濾波,但濾波的同時也使圖像邊緣產(chǎn)生一定程度的模糊。Marr 算子將噪聲濾波與邊緣提取相結(jié)合,但當(dāng)模板較小時抗噪性能不良,模板較大時計算費時。
2. 2. 3 基于特定理論的分割方法
隨著數(shù)學(xué)和人工智能的發(fā)展,出現(xiàn)了一些新的邊緣檢測方法,如數(shù)學(xué)形態(tài)學(xué)法、小波變換法、人工神經(jīng)網(wǎng)絡(luò)法、遺傳算法、基于模糊理論的算法等。 20 世紀(jì) 90 年代初,Mallat 在圖像多分辨分析理論的基礎(chǔ)上,提出了小波變換局部模極大值邊緣檢測方法[58-59],在噪聲圖像中取得了較好的邊緣檢測效果。后來,人們在 Mallat 理論框架下,提出了多尺度邊緣檢測方法[60]。多尺度邊緣檢測方法主要思想在較大的尺度下能對邊緣精確檢測,而在較小的尺度下能對邊緣點精確定位。小波變換的突出優(yōu)點是其多分辨率,圖像的每個尺度的小波變換都提供了一定的邊緣信息。小波分析在時域和頻域都具有良好的局部化性質(zhì),可聚焦到對象的任意細(xì)節(jié),是圖像處理領(lǐng)域的熱點。雖然人們提出了多種的邊緣檢測方法[61-62],但邊緣檢測時抗噪性和檢測精度的矛盾仍然是要研究的重點內(nèi)容之一。
基于數(shù)學(xué)形態(tài)學(xué)邊緣檢測方法[63-64]的基本思想是用具有一定形態(tài)的結(jié)構(gòu)元素提取圖像中的對應(yīng)形狀,以達(dá)到對圖像分析和識別的目的。采用多結(jié)構(gòu)元素的數(shù)學(xué)形態(tài)學(xué)算法,既能提取細(xì)小邊緣,又能很好的抑制噪聲,結(jié)構(gòu)元素選取靈活,但在靈活的同時也導(dǎo)致算法的適應(yīng)性變差。
近年來有一些新的研究手段如神經(jīng)網(wǎng)絡(luò)、遺傳算法和小波方法等被引入到圖像分割的閾值選取中[65-69],其效果仍在探索之中。
雖然有許多圖像分割的方法,這些算法的共性問題在于分割精度與抗噪性的矛盾,同時,高實時性處理算法的研究遠(yuǎn)遠(yuǎn)滯后于通用圖像處理算法的研究,應(yīng)用于實際生產(chǎn)中的一些算法在準(zhǔn)確性、實時性和可操作性上也還存在較大的困難。至今,圖像分割算法大都是針對具體問題所提出的,雖然每年都有新的圖像分割算法提出,但是并沒有一種通用的算法能適用于所有的圖像分割處理。——論文作者:湯勃,孔建益,伍世虔