發(fā)布時間:2015-03-06所屬分類:科技論文瀏覽:1次
摘 要: 摘要:漢字識別屬于大類別模式識別,人工神經(jīng)網(wǎng)絡(luò)可以通過函數(shù)逼近、數(shù)據(jù)分類、數(shù)據(jù)聚類三種作用方式以及聯(lián)想的特殊模式對漢字進行識別。Hopfield神經(jīng)網(wǎng)絡(luò)作為反饋網(wǎng)絡(luò)的一種,其自聯(lián)想記憶網(wǎng)絡(luò)可以使系統(tǒng)不需要通過大量的訓練即可對漢字進行識別,因此Hopfi
摘要:漢字識別屬于大類別模式識別,人工神經(jīng)網(wǎng)絡(luò)可以通過函數(shù)逼近、數(shù)據(jù)分類、數(shù)據(jù)聚類三種作用方式以及“聯(lián)想”的特殊模式對漢字進行識別。Hopfield神經(jīng)網(wǎng)絡(luò)作為反饋網(wǎng)絡(luò)的一種,其自聯(lián)想記憶網(wǎng)絡(luò)可以使系統(tǒng)不需要通過大量的訓練即可對漢字進行識別,因此Hopfield神經(jīng)網(wǎng)絡(luò)對于漢字識別來說具有獨特的優(yōu)勢。其中的離散型Hopfield神經(jīng)網(wǎng)絡(luò)能夠通過串行異步和并行同步的工作方式,使其反饋過程具有非常好的穩(wěn)定性,而網(wǎng)絡(luò)只有通過不斷的演變穩(wěn)定在某一吸引子狀態(tài)時,才能夠?qū)崿F(xiàn)正確的聯(lián)想。
關(guān)鍵詞:計算機技術(shù),神經(jīng)網(wǎng)絡(luò),論文發(fā)表
聯(lián)機手寫識別可以分為訓練階段和識別階段。訓練階段流程依次為:標準書寫字符圖像預處理,提取特征并建立特征庫,建立Hopfield網(wǎng)絡(luò)模型,訓練網(wǎng)絡(luò),保存權(quán)值。識別階段的流程為:坐標序列轉(zhuǎn)化為bmp圖像,預處理測試樣本,提取特征,送入網(wǎng)絡(luò)運行,運行網(wǎng)絡(luò)到平衡狀態(tài),分析結(jié)果值。根據(jù)聯(lián)機手寫識別的工作流程以及Hopfield網(wǎng)絡(luò)模型的理論,基于Hopfield神經(jīng)網(wǎng)絡(luò)的聯(lián)機手寫識別系統(tǒng)在Matlab環(huán)境下得到了仿真模擬,效果非常理想。
手寫識別系統(tǒng)能夠彌補普通鍵盤的不足,在提高漢字書寫頻率的同時,能夠滿足不同層次人群對計算機應(yīng)用的技術(shù)需要。基于Hopfield神經(jīng)網(wǎng)絡(luò)的聯(lián)機手寫識別系統(tǒng)一起自身獨特的性能,不僅能夠滿足手寫漢字識別的正確率,而且其識別過程速度非常快。因此它對于實現(xiàn)聯(lián)機手寫識別以及圖像識別具有非常重要的意義。
隨著計算機技術(shù)的快速發(fā)展,其在人們的辦公學習和日常生活成了不可替代的工具。鍵盤已經(jīng)幾乎完全替代了筆在人們生活中的地位,隨之而來的后果就是人們越來越少的區(qū)書寫漢字,導致越來越多的中國人甚至都忘記了漢字該如何書寫,這種現(xiàn)象在很多研究和報道中都有體現(xiàn)。計算機和鍵盤是由西方國家發(fā)明的,其符合西方國家的語言習慣,對于中國人來說,用字母、符號去完成方塊漢字的輸入就需要使用者非常熟悉漢語拼音或者五筆編碼,對于文化程度較低的使用者來說,這些都限制著他們使用計算機。鑒于計算機鍵盤的這些缺陷,聯(lián)機手寫輸入法應(yīng)運而生,這為計算機的輸入帶來了新的發(fā)展機遇和挑戰(zhàn)。
1 聯(lián)機漢字手寫識別的意義及難點
聯(lián)機漢字識別是用書寫板代替?zhèn)鹘y(tǒng)紙張,筆尖通過數(shù)字化書寫板的軌跡通過采樣系統(tǒng)按時間先后發(fā)送到計算機中,計算機則自動的完成漢字的識別和顯示。
1.1 聯(lián)機漢字手寫識別的意義
聯(lián)機手寫漢字識別的誕生具有非常重要的意義。首先這種輸入方法延續(xù)了幾千年中華文明的寫字習慣,實現(xiàn)用戶的手寫輸入,對于長時間不提筆寫字的用戶來說能夠加強其對漢字書寫方面的認識,防止“提筆忘字”現(xiàn)象的繼續(xù)惡化。其次,手寫漢字輸入不需要學習和記憶計算機的漢字編碼規(guī)則,其完全符合中國人的寫字習慣,使人機之間的交流更人性化,更方便快捷。另外,隨著移動智能終端的不斷普及,聯(lián)機漢字手寫識別的應(yīng)用范圍將進一步擴大,以適用于不同層次人群對信息輸入的需要,具有較大的市場發(fā)展前景。
1.2 聯(lián)機手寫漢字識別問題的難點
手寫漢字識別是光學字符讀出器中最難的部分,也是其最終的目標,手寫漢字識別的應(yīng)用主要依賴于其正確識別率和識別速度[1]。手寫漢字識別系統(tǒng)的問題具有其特殊性:
(1)中國漢字量大。我國目前的常用漢字大概在4000個左右,在實際應(yīng)用中的漢字識別系統(tǒng)應(yīng)該能夠完全識別這些常用的字才能夠滿足需要,由于超大的漢字量,使得手寫識別的正確率和識別速度一直不高。
(2)字體多,結(jié)構(gòu)復雜。漢字的手寫字體豐富多彩,且漢字的筆畫繁多,以及復雜的結(jié)構(gòu),再加上漢字中的形近字頗多,這些都為漢字識別系統(tǒng)的發(fā)展造成了很大的困難。
(3)書寫變化大。不同用戶在進行手寫輸入時其字體的變化是很大的,這種變化因人而異,對漢字識別造成了很大的干擾,增加了漢字匹配的難度。
2 人工神經(jīng)網(wǎng)絡(luò)概述
人工神經(jīng)網(wǎng)絡(luò)是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進行信息處理的數(shù)學模型,通常簡稱為神經(jīng)網(wǎng)絡(luò),是一種仿生物神經(jīng)的信號處理模型。在二十世紀四十年代初人們開始進行神經(jīng)網(wǎng)絡(luò)的研究,經(jīng)過幾十年的發(fā)展,神經(jīng)網(wǎng)絡(luò)也產(chǎn)生了一系列的突破,目前應(yīng)用最多的是Hopfield模型和BP算法。
神經(jīng)網(wǎng)絡(luò)的一般模型一般包括十個方面:環(huán)境、處理單元、傳播規(guī)則、神經(jīng)網(wǎng)絡(luò)的狀態(tài)、互聯(lián)模式、穩(wěn)定狀態(tài)、操作模式、活躍規(guī)則、活化函數(shù)和學習算法。其中,神經(jīng)元、互聯(lián)模式、學習算法是神經(jīng)網(wǎng)絡(luò)模型中的三個關(guān)鍵因素。神經(jīng)網(wǎng)絡(luò)的一個重要內(nèi)容就是學習,其學習方式可以分為監(jiān)督學習和無監(jiān)督學習,其學習過程一般遵循Hebb規(guī)則,誤差修正學習算法以及勝者為王的學習規(guī)則,其中Hebb規(guī)則是神經(jīng)網(wǎng)絡(luò)學習中最基本的規(guī)則。
人工神經(jīng)網(wǎng)絡(luò)具有獨特的優(yōu)越性。首先其具有主動學習的功能,在漢字識別過程中,先將漢字模板及可能的識別結(jié)果輸入到神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)能夠通過其自身的學習過程來實現(xiàn)對漢字的識別,自學功能對于神經(jīng)網(wǎng)絡(luò)的預測功能具有非常重要的意義。其次,神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有聯(lián)想存儲功能,其反饋功能能夠?qū)崿F(xiàn)這種聯(lián)想。另外,通過計算機的高速運算能力,神經(jīng)網(wǎng)絡(luò)具有高速尋找優(yōu)化解的能力。