亚洲h色精品,亚洲精品久久久久,欧美激情一二三区,成人影院入口

學術咨詢服務,正當時......期刊天空網是可靠的職稱工作業績成果學術咨詢服務平臺!!!

機器視覺技術研究進展及展望

發布時間:2022-03-17所屬分類:計算機職稱論文瀏覽:1

摘 要: 摘 要:機器視覺是建立在計算機視覺理論工程化基礎上的一門學科,涉及到光學成像、視覺信息處理、人工智能以及機電一體化等相關技術。隨著我國制造業的轉型升級與相關研究的不斷深入,機器視覺技術憑借其精度高、實時性強、自動化與智能化程度高等優點,成為了提升機器

  摘 要:機器視覺是建立在計算機視覺理論工程化基礎上的一門學科,涉及到光學成像、視覺信息處理、人工智能以及機電一體化等相關技術。隨著我國制造業的轉型升級與相關研究的不斷深入,機器視覺技術憑借其精度高、實時性強、自動化與智能化程度高等優點,成為了提升機器人智能化的重要驅動力之一,并被廣泛應用于工業生產、農業以及軍事等各個領域。在廣泛查閱相關文獻之后,針對近十多年來機器視覺相關技術的發展與應用進行分析與總結,旨在為研究學者與工程應用人員提供參考。首先,總結了機器視覺技術的發展歷程、國內外的機器視覺發展現狀;其次,重點分析了機器視覺系統的核心組成部件、常用視覺處理算法以及當前主流的機器視覺工業軟件;然后,介紹了機器視覺技術在產品瑕疵檢測、智能視頻監控分析、自動駕駛與輔助駕駛與醫療影像診斷等 4 個典型領域的應用;最后分析了當前機器視覺技術所面臨的挑戰,并對其未來的發展趨勢進行了展望,為機器視覺技術的發展和應用推廣發揮積極作用。

機器視覺技術研究進展及展望

  關 鍵 詞:機器視覺;成像系統;視覺處理算法;視覺軟件;挑戰與發展趨勢

  近年來,隨著現代制造業產業結構調整和轉型升級的不斷深入,越來越多企業開始施行“機器換人”,使得機器人在汽車、物流、航空航天、船舶乃至食品等領域得到了越來越廣泛的應用,并帶動了相關產業的發展。機器人是一種集機械、傳感、識別、決策與控制等多種先進技術于一身,并具有部分智能能力的自動化設備或裝置[1],被稱為“制造業皇冠頂端的明珠”,世界各國對其發展的重視程度與日俱增。機器人技術及其應用已成為當今科技和產業發展的“必爭之地”,具有重要的戰略意義。

  作為機器人的“眼睛”,機器視覺系統是一種借助光學裝置和非接觸的傳感器獲得被檢測物體的特征圖像,并通過計算機從圖像中提取信息,進行分析處理,進而實現檢測和控制的裝置。機器視覺系統具有實時性好、定位精度高等優點,能有效地增加機器人的靈活性與智能化程度[2],是實現工業自動化和智能化的重要手段之一。隨著各類技術的不斷完善,以及制造產業中高質量產品的需求增多,機器視覺從最開始主要用于工業電子裝配缺陷檢測[3-4],已逐步應用到汽車制造[5]、食品監控[6-7]、視覺導航[8-9]、交通[10-11]、軍事[12]、紡織加工[13]等多個領域[14-15],市場規模不斷擴大。因此,研究機器視覺相關技術對提升工業智能機器人的產業發展具有重要意義。

  本文主要對機器視覺的發展歷史、研究現狀、相關核心技術及其應用進行總結與分析,并對未來發展趨勢做出展望。

  1 機器視覺發展現狀

  1.1 機器視覺發展史

  機器視覺是建立在計算機視覺理論工程化基礎上的一門學科,涉及到光學成像、視覺信息處理、人工智能以及機電一體化等相關技術[16],經歷了從二維到三維的演化過程。機器視覺發展于 20 世紀 50 年代對二維圖像識別與理解的研究,包括字符識別、工件表面缺陷檢測、航空圖像解譯等。60 年代,麻省理工學院 ROBERTS[17]提出了利用物體的二維圖像來恢復出諸如立方體等物體的三維模型(如彈簧模型與廣義圓柱體模型等)以及建立空間關系描述,開辟了面向三維場景理解的立體視覺研究。70 年代麻省理工學院 MARR[18]創立系統化的視覺信息處理理論,指出人類視覺從三維場景中提取對觀測者有用信息的過程需要經過多層次的處理,并且這種處理過程可以用計算的方式重現,從而奠定了計算機視覺理論化和模式化的基礎。此后,計算機視覺技術在 80 年代進入了最蓬勃發展的時期,主動視覺等新的概念、方法與理論不斷涌現。與此同時,隨著 CCD 圖像傳感器、CPU 與 DSP 等硬件與圖像處理技術的飛速發展[19],計算機視覺逐步從實驗室理論研究轉向工業領域的相關技術應用,從而產生了機器視覺。由于具有實時性好、定位精度與智能化程度高等特點,機器視覺已經在智能汽車[9]、電子[20-21]、醫藥[22]、食品[23-24]、農業等領域得到了廣泛的應用[25-27],如占機器視覺市場需求 40%~50%的半導體制造行業,從上游的晶圓加工切割到高精度 PCB 定位、從 SMT 元件放置到表面缺陷檢測等都依賴高精度的機器視覺引導與定位。

  1.2 國外機器視覺現狀

  機器視覺早期發展于歐美和日本等國家,并誕生了許多著名的機器視覺相關產業公司,包括光源供應商日本 Moritex;鏡頭廠家美國 Navitar、德國 Schneider、德國 Zeiss、日本 Computar 等;工業相機廠家德國 AVT、美國 DALSA、日本 JAI、德國Basler、瑞士 AOS、德國 Optronis;視覺分析軟件廠家德國 MVTec、美國康耐視(Cognex)、加拿大 Adept 等,以及傳感器廠家日本松下(Panasonic)與基恩士(Keyence)、德國西門子、歐姆龍(Omron)、邁思肯(Microscan)等。盡管近 10 年來全球產業向中國轉移,但歐美等發達國家在機器視覺相關技術上仍處于統治地位,其中美國 Cognex 與日本 Keyence 幾乎壟斷了全球 50%以上的市場份額,全球機器視覺行業呈現兩強對峙狀態。在諸如德國工業 4.0 戰略、美國再工業化和工業互聯網戰略、日本機器人新戰略、歐盟“火花”計劃等戰略與計劃以及相關政策的支持下,發達國家與地區的機器視覺技術創新勢頭高昂,進一步擴大了國際機器視覺市場的規模。如圖 1 所示,至 2018 年,機器視覺系統的全球市場規模接近 80 億美元,年均增長率超過15.0%。世界最大的機器視覺市場——德國市場,其規模為 27.1 億美元,占比超過全球總量的三分之一。

  1.3 國內機器視覺現狀

  相比發達國家,我國直到 90 年代初才有少數的視覺技術公司成立,相關視覺產品主要包括多媒體處理、表面缺陷檢測以及車牌識別等。但由于市場需求不大,同時產品本身存在軟硬件功能單一、可靠性較差等問題,直到 1998 年開始,我國機器視覺才逐步發展起來,其發展經歷了啟蒙、發展初期、發展中期和高速發展等階段[28]。

  機器視覺啟蒙階段:自 1998 年開始,隨著外資大量的電子相關企業在大陸投資建廠,企業迫切需要得到大量機器視覺相關技術的支持,一些自動化公司開始依托國外視覺軟硬件產品搭建簡單專用的視覺應用系統,并不斷地引導和加強中國客戶對機器視覺技術和產品的理解和認知,讓更多相關產業人員展現視覺技術帶給自動化產業的獨特價值和廣泛應用前景,從而逐步帶動機器視覺在電子、特種印刷等行業的廣泛應用[29]。

  機器視覺發展初期階段:從 2002 年到 2007 年期間,越來越多的企業開始針對各自的需求尋找基于機器視覺的解決方案,以及探索與研發具有自主知識產權的機器視覺軟硬件設備,在 USB2.0 接口的相機和采集卡等器件方面,逐漸占據了入門級市場;同時在諸如檢測與定位、計數[30]、表面缺陷檢測[31]等應用與系統集成方面取得了關鍵性突破。隨著國外生產線向國內轉移以及人們日益增長的產品品質需求,國內很多傳統產業如棉紡[32- 33]、農作物分級[34-35]、焊接[36]等行業開始嘗試用視覺技術取代人工來提升質量和效率。

  機器視覺發展中期階段:從 2008 年到 2012 年期間,出現了許多從事工業相機、鏡頭、光源到圖像處理軟件等核心產品研發的廠商,大量中國制造的產品步入市場。相關企業的機器視覺產品設計、開發與應用能力,在不斷實踐中也得到了提升。同時,機器視覺在農業[37]、制藥[38]、煙草[39]等多行業得到深度廣泛地應用,培養了一大批系統級相關技術人員。

  機器視覺高速發展階段:近年來,我國先后出臺了促進智能制造、智能機器人視覺系統以及智能檢測發展的政策文件,《中國制造 2025》提出實施制造強國,推動中國到 2025 年基本實現工業化,邁入制造強國行列;《高端智能再制造行動計劃 (2018—2020 年)》提出中國智能檢測技術在 2020 年要達到國際先進水平。得益于相關政策的扶持和引導,我國機器視覺行業的投入與產出顯著增長,市場規模快速擴大。據高工產業機器人研究所 (GGII)統計,2017 年中國機器視覺市場規模達到 70 億元,同比增速超 25%,高于其他細分領域增速,如圖 2 所示,預計到 2020 年市場規模將超過 120 億元。同時我國機器視覺正逐漸向多領域、多行業、多層次應用延伸,目前我國機器視覺企業已超 100 余家,如凌華科技、大恒圖像、商湯、曠視、云從科技等;機器視覺相關產品代理商超過 200 家,如廣州嘉銘工業、微視圖像等;系統集成商超過 50 家,如大恒圖像、凌云光子等,產品涵蓋從成像到視覺處理與控制整個產業鏈,總體上視覺應用呈現百花齊放的旺盛狀態。

  然而,盡管目前我國機器視覺產業取得了飛速發展,但總體來說,大型跨國公司占據了行業價值鏈的頂端,擁有較為穩定的市場份額和利潤水平;我國機器視覺公司規模較小,如作為中國機器視覺系統的最大供應商,大恒新紀元科技只占有 1.4% 的全球市場份額;與美國 Cognex、日本 Keyence 等大企業相比,許多基礎技術和器件,如圖像傳感器芯片、高端鏡頭等仍全部依賴進口,國內企業主要以產品代理、系統集成、設備制造、以及上層二次應用開發為主,底層開發商較少,產品創新性不強,處于中低端市場,利潤水平偏低。

  2 機器視覺組成與關鍵技術

  一般來說,機器視覺系統包括光學照明、成像系統、視覺信息處理等關鍵組成部分[40]。

  2.1 照明系統

  照明系統的作用主要是將外部光以合適的方式照射到被測目標物體以突出圖像的特定特征,并抑制外部干擾等,從而實現圖像中目標與背景的最佳分離,提高系統檢測精度與運行效率。由于影響照明系統的因素復雜多變,目前沒有普適的機器視覺照明方案,往往需要針對具體的應用環境,并考慮待檢測目標與背景的光反射與傳輸特性區別、距離等因素選擇合適的光源類型、照射方式及光源顏色[41]來設計具體的照明方案,以達到目標與背景的最佳分割效果。

  機器視覺光源主要包括鹵素燈、熒光燈、氙燈、 LED、激光、紅外、X 射線等。其中,鹵素燈和氙燈具有寬的頻譜范圍和高能量,但屬于熱輻射光源,發熱多,功耗相對較高;熒光燈屬于氣體放電光源,發熱相對較低,調色范圍較寬,而 LED 發光是半導體內部的電子遷移,產生的發光,屬于固態電光源,發光過程不產生熱,具有功耗低、壽命長、發熱少、可以做成不同外形等優點,LED 光源已成為了機器視覺的首選光源。而紅外光源與 X 射線光源應用領域較為單一;各種光源性能對比見表 1[41]。

  從光源形狀角度分類,照明光源可分為條形、穹形、環形、同軸以及定制等光源。從光源照射方式上分,照明系統可分為明/暗場、前向、側向、背向、結構光、多角度照射與頻閃照明等[40,42]。其中,明場照明的光源位置較高,使得大部分光線反射后進入了相機;反之,暗場照明采用低角度照射方式使得光線反射后不能進入照相機,以提高對表面凹凸表現能力,暗場照明常用于光滑面板如手機殼、玻璃基片等表面劃痕檢查;背向照明是被測物置于光源和相機之間以獲取較高對比度的圖像,常用于分析物體的輪廓或透明物體內的異物[38];多角度照射則采用不同角度光照方式,以提取三維信息,如電路板焊接缺陷檢測往往采用多角度照射的 AOI 光源來提高成像質量[4]。而結構光照明是將激光或投影儀產生的光柵投射到被測物表面上,然后根據投影圖案產生的畸變程度來重建出物體的三維信息。

  此外,光源顏色會對圖像對比度產生顯著影響,一般來說,波長越短,穿透性就越強,反之則擴散性越好。因此光源選擇需要考慮光源波長特性,如紅色光源多用于半透明等物體檢測,表 2 給出了不同顏色光源的特點對比及其應用場景[43-44]。如 VRIESENGA 等[45]利用控制光源的顏色來改善圖像的對比度。同時,光源旋轉需要考慮光源與物體的色相性,通過選擇色環上相對應的互補顏色來提高目標與背景間的顏色對比度[41-42],互補色環圖如圖 3 所示。因此,在實際應用中,需考慮光源與物體顏色相關性,選擇合適的光源來過濾掉干擾,如對于某特定顏色的背景,常采用與背景顏色相近光源來提高背景的亮度,以改善圖像對比度[43-44]。

  2.2 成像系統

  成像系統是機器人視覺感知系統中的“視”部分,采用鏡頭、工業相機與圖像采集卡等相關設備獲取被觀測目標的高質量圖像,并傳送到專用圖像處理系統進行處理。

  相關知識推薦:計算機視覺圖像處理論文怎么發表ei期刊

  鏡頭相當于人眼睛的晶狀體,其作用是將來自目標的光輻射聚焦在相機芯片的光敏面陣上。鏡頭按照等效焦距可分為廣角鏡頭、中焦距鏡頭、長焦距鏡頭;按功能可分為變焦距鏡頭、定焦距鏡頭、定光圈鏡頭等。鏡頭的質量直接影響到獲取圖像的清晰度、畸變程度等,若成像系統獲取的圖像信息存在嚴重損失,往往在后面的環節中難以恢復,因此合理選擇鏡頭是機器視覺中成像光路設計的重要環節。

  鏡頭選擇時需要考慮鏡頭焦距、視野、工作距離、畸變[46]、雜散光抑制等因素,選取合適的焦距保證被攝物成像的具有合適的大小,并且成像畸變小。

  工業相機是將光輻射轉變成模擬/數字信號的設備,通常包括光電轉換、外圍電路、圖像輸出接口等部件。按數據傳送的方式不同,相機可以分為 CCD 相機與 CMOS 相機 2 類,其中,CCD 成像質量好,但制造工藝相對復雜,成本較高,而 CMOS 電源消耗量低,數據讀取快。按照傳感器的結構特性不同,工業相機可分為面陣式與線陣式 2 類。面陣相機可以一次獲得整幅圖像,測量圖像直觀,其應用面較廣,但由于生產技術的制約,單個面陣很難滿足工業連續成像的要求。線陣相機每次成像只能獲得一行圖像信息,因此需要保證被拍攝物體相對相機直線移動,逐次掃描獲得完整的圖像。線陣相機具有分辨率高等特點,常用于條狀、筒狀如布匹、鋼板、紙張等檢測。由于逐次掃描需要進行相對直線移動,成像系統復雜性和成本有所增加。

  相機選擇需要考慮光電轉換器件模式、響應速度、視野范圍、系統精度等因素。此外,由于工業設計的需求,當使用工業模擬相機時必須采用圖像采集卡將采集的信號轉換為數字圖像進行傳輸存儲。因此,圖像采集卡需要與相機協調工作來實時完成圖像數據的高速采集與讀取等任務,針對不同類型的相機,有 USB,PCI,PCI64,ISA 等不同的總線形式的圖像采集卡。

  2.3 視覺信息處理

  視覺信息處理充當了機器視覺的“大腦”部分,對相機采集的圖像進行處理分析實現對特定目標的檢測、分析與識別,并做出相應決策,是機器視覺系統的“覺”部分。視覺信息處理一般包括圖像預處理、圖像定位與分割、特征提取、模式分類、語義理解等層次[3]。

  2.3.1 圖像預處理圖像預處理

  部分主要借助相機標定、去噪、增強、配準與拼接、融合等操作來提高圖像質量、降低后續處理難度。相機標定旨在求解相機的內參 (焦距,畸變系數)和外參(旋轉矩陣和平移向量)以提供物體表面某點的三維幾何位置與其在圖像中對應點之間精確坐標關系,標定精度高低直接影響到機器視覺定位的精度[47-48]。常用標定方法包括張正友標定法[49]、自標定法[48]等。同時,由于各種電磁等干擾,獲取的圖像常含有椒鹽、高斯等多種噪聲,對比度低,并存在運動模糊等現象,因此需要對圖像去噪或結構增強以改善圖像質量。其中,去噪方法一般可分為空間域與變換域去噪 2 大類[50],而主流的圖像增強方法包含直方圖均衡化、圖像銳化、視覺模型增強、運動模糊去除等方法。同時,由于視野范圍限制、成像模式的不同,需要對生產線上不同位置獲取的多模或同模態圖像進行配準,再實現多幅圖像拼接或融合處理。圖像配準一般分為基于圖像灰度的配準方法與基于圖像特征的配準方法[51-52]。基于灰度的配準方法直接采用歸一化的互相關、互信息等相似性度量函數來計算圖像灰度值之間的相似性,并確定圖像間的配準參數,此類方法簡單、配準精度高,但對圖像灰度變化、旋轉、變形以及遮擋比較敏感,計算復雜度高、往往需要采用各種優化策略。基于特征的配準方法首先從圖像提取各種點、線、區域等特征,然后進行空間約束或不變特征匹配得到特征間的匹配關系,進而估計出圖像之間變換關系。此類方法計算速度快,但依賴特征的提取。由于在配準過程中,需要搜索多維空間,機器視覺系統常采用金字塔、小波方法以及各種優化策略來減小配準計算量。在圖像配準的基礎上,有些工業生產線需對多源圖像進行融合,保證可以盡量地提取有用信息,并去除冗余或干擾信息,在較少的計算代價的前提下高效利用圖像資源,并改善計算機解譯精度和可靠性[53]。根據圖像表征層次的不同,圖像融合可分為像素級融合[54]、特征級融合和決策級融合[35,55-56] 3 個層次的融合,通過融合技術可以提高視覺目標檢測的識別與抗干擾能力。

  2.3.2 圖像定位與分割

  圖像定位與分割主要利用目標邊界、幾何形狀等先驗特征或知識確定待檢測目標的位置或從圖像中分割出目標,是確定目標位置、大小、方向等信息的重要手段。

  圖像定位利用圖像灰度或特征信息來確定圖像中被檢測物體的位置、大小及旋轉角度等,主要采用模板匹配方法實現[57-58],即通過計算模板圖像 (通常是被檢測物體圖像)和待搜索圖像的相似性度量,然后尋找相似性度量值最大或最小對應的匹配位置即是目標位置。模板匹配具有速度快、定位精度高、簡單等優點[59],在視覺定位與引導中得到了廣泛應用。由于需要給定待檢測物體的圖像,因此模板匹配定位方法只適用于背景簡單、特征固定的物體,難以用于不規則形狀物體的定位。

  圖像分割是根據目標及背景特性將圖像劃分為多個具有獨特屬性的非重疊區域,進而確定目標位置、區域大小。圖像分割方法一般可以分為:

  (1) 閾值分割方法。首先對圖像像素灰度分布特性進行分析,然后采用先驗知識或 Otsu[60]等方法確定最優灰度閾值將圖像分割 2 個或多個局部區域。該方法簡單高效,適用于待檢測目標與背景具有明顯差異的情況。

  (2) 區域分割方法。利用區域內圖像特征(如顏色、紋理等)具有均勻性或相似性將像素集合起來實現圖像分割,包括區域生長[61]、分裂合并、分水嶺[62]等算法。此類方法能夠處理較為復雜圖像,但計算量大,而且種子點的選取與迭代終止條件的設定容易影響分割結果,甚至可能會破壞區域邊界。

  (3) 基于邊緣的分割方法[63]。該方法利用不同圖像區域在邊界處有明顯灰度跳變或不連續,找到目標區域的邊緣來實現圖像分割。由于不連續性常通過求導數來實現,因此該類方法適用于噪聲比較小的圖像,尤其是二階微分算子對噪聲十分敏感。

  (4) 基于圖的分割方法。借助圖論的思想,將待分割圖像轉換為帶權無向圖,其中每一個像素即為圖中的一個節點,將圖像分割問題轉化為圖頂點的標注問題,再利用最小優化準則如圖割[64]、隨機游走[65]等實現圖像的最佳分割[66]。該方法可以較好地分割圖像,但計算復雜度高。

  (5) 基于神經網絡的語義分割方法[67]。模擬人類感知過程,采用如脈沖耦合神經網絡等方法[68] 來處理復雜的非線性問題。近年來,深度學習技術在圖像語義分割領域得到了深入研究,提出了如 FCN[69],DeepLab[70],Mask R-CNN[71],U-Net[72] 等分割算法,并在自動駕駛[71]、影像診斷[72]等領域得到應用。該類方法適應性較強,能夠對被分割區域分配不同的標簽,但存在學習過程復雜,計算量大等缺點。

  2.3.3 圖像特征提取

  圖像識別是先提取形狀、面積、灰度、紋理等特征[73-74],然后借助模式識別等方法如模式匹配[57]、支持向量機、深度學習[75]等來實現目標分類、缺陷檢測等功能,滿足工業機器視覺不同的應用需求。因此,圖像特征提取很大程度上影響圖像識別結果。

  圖像特征提取可看作為從圖像中提取關鍵有用低維特征信息的過程,以使獲取的低維特征向量能夠有效的描述目標,并保證同類目標具有較小的類內距而不同類目標具有較大的類間距。高效的特征提取可提高后續目標識別精度與魯棒性,降低計算復雜度。常用的二維圖像特征包括有形狀特征、紋理特征、顏色特征等。

  (1) 紋理特征[76-77]。描述物體表面結構排列以及重復出現的局部模式,即物體表面的同質性,不依賴于顏色或亮度,具有局部性與全局性,對旋轉與噪聲不敏感。紋理特征提取方法包括有統計法如灰度共生矩陣[78]、局部二值模式(LBP)[79]、Gabor 濾波器[80]、小波變換[81]等。

  (2) 形狀特征。根據僅提取輪廓或整個形狀區域的不同,形狀特征可細分為輪廓形狀[82]與區域形狀 2 類[83-84]。

  輪廓形狀是對目標區域的包圍邊界進行描述,其描述方法包括有邊界特征法、簡單幾何特征、基于變換域(如傅里葉描述子[85]、小波描述子)、曲率尺度空間(CSS)[86]、霍夫變換[87]等方法。輪廓特征描述量小,但包含信息較多,能有效地減少計算量;但輪廓特征對于噪聲和形變敏感,常難以提取完整的輪廓信息。

  區域形狀特征是針對目標輪廓所包圍的區域中的所有像素灰度值或對應的梯度加以描述,主要有幾何特征(如面積、質心、分散度等)、拓撲結構特征(如歐拉數[88])、矩特征(如 Hu 不變矩[89]、 Zernike 矩[90-91])、梯度分布特征(如 HOG[92]、 SIFT[93]等)。

  (3) 顏色特征[94]。用于描述圖像所對應景物的外觀屬性,是人類感知和區分不同物體的基本視覺特征之一,其顏色對圖像平移、旋轉與尺度變化具有較強的魯棒性。顏色空間模型主要有 HSV[94], RGB,HSI,CHL,LAB,CMY 等。常用的顏色特征的表征方法包括有顏色直方圖[91,95]、顏色相關圖[96]、顏色矩[97]、顏色聚合向量[98]等。

  2.3.4 模式分類

  模式分類本質上是通過構造一個多分類器,將從數據集中提取的圖像特征映射到某一個給定的類別中,從而實現目標分類與識別。分類器的構造性能直接影響到其識別的整體效率,也是模式識別的研究核心。模式分類可分為統計模式識別、結構模式識別、神經網絡以及深度學習等主要方法,對比情況見表 3。

  統計模式識別結合了統計概率的貝葉斯決策理論以對模式進行統計分類,其主要方法有貝葉斯[99]、 Fisher 分類器[100]、支持向量機[91]、Boosting[101]等,統計模式識別理論完善,并取得了不少應用成果,但很少利用模式本身的結構關系。結構模式識別 (又稱句法模式識別)首先將一個模式分解為多個較簡單的子模式,分別識別子模式,最終利用模式與子模式分層結構的樹狀信息完成最終識別工作。結構模式識別理論最早用于漢字識別,能有效區分相似漢字,對字體變化的適應性強,但抗干擾能力差。因此,很多情況下往往同時結合統計模式和句法模式識別來解決具體問題。

  神經網絡是一種模仿動物神經網絡進行分布式并行信息處理機理的數學模型,其通過調整內部大量節點之間相互連接關系來實現信息并行處理。目前神經網絡又可進一步分為 BP 神經網絡、 Hopfield 網絡與 ART 網絡等。神經網絡具有很強的非自線性擬合,記憶以及自學習能力,學習規則簡單,便于計算機實現。因此得到了廣泛的應用[102-104]。但神經網絡具有學習速度慢,容易陷入局部極值以及求解時會遇到梯度消失或者梯度爆炸等缺點。

  2006 年,HINTON 和 SALAKHUTDINOV[105] 提出了一種基于無監督的深度置信網絡,解決了深度神經網絡訓練的難題,掀起了深度學習的浪潮,先后涌現了包括稀疏自編碼器[106]、受限玻爾茲曼機、卷積神經網絡[107]、循環神經網絡、深度生成式對抗網絡[108]等模型。與傳統的機器學習相比,深度學習提倡采用端到端的方式來解決問題,即直接將圖像特征提取與模式分類集合在一起,然后根據具體的模式分類目標損失函數(如交叉熵損失、Hinge 損失函數等)從數據中自動地學習到有效的特征[109]并實現模式分類,學習能力強。因此深度學習在在計算機視覺[110]、語音識別[111]、字符識別[112]、交通[113]、農業[6,114]、表面缺陷檢測[75,115] 等領域取得了巨大成功。深度學習也存在缺少完善的理論支持、模型正確性驗證復雜且麻煩、需要大量訓練樣本、計算量大等問題。相信隨著深度學習研究的不斷深入,將為機器視覺帶來更廣闊的發展空間。——論文作者:朱 云, 凌志剛, 張雨強

2023最新分區查詢入口

SCISSCIAHCI

主站蜘蛛池模板: 越西县| 六枝特区| 汤原县| 桓台县| 许昌县| 南溪县| 庄河市| 东乡族自治县| 开鲁县| 辽宁省| 诏安县| 布拖县| 上林县| 达拉特旗| 额尔古纳市| 定日县| 固阳县| 盘锦市| 顺昌县| 陆良县| 靖江市| 盐津县| 阳谷县| 积石山| 普安县| 福贡县| 六安市| 平武县| 大连市| 弥渡县| 库尔勒市| 慈溪市| 桂东县| 西宁市| 闻喜县| 扎鲁特旗| 尼勒克县| 新绛县| 华阴市| 桓仁| 西华县|