- 2019年7月10日-12日,上海攬境展覽主辦的2019年藍(lán)鯨國(guó)際標(biāo)簽展、包裝展...[詳情]
2019年藍(lán)鯨標(biāo)簽展_藍(lán)鯨軟包裝展_藍(lán)鯨
- 今日排行
- 本周排行
- 本月排行
- 膠印油墨
- 膠印材料
- 絲印材料
印刷體文字的識(shí)別研究方法分類介紹
2010-12-06 15:17 來(lái)源:中國(guó)中部印刷網(wǎng) 責(zé)編:江佳
- 摘要:
- 識(shí)別方法是整個(gè)系統(tǒng)的核心。用于漢字識(shí)別的模式識(shí)別方法可以大致分為結(jié)構(gòu)模式識(shí)別、統(tǒng)計(jì)模式識(shí)別及兩者的結(jié)合。下面分別進(jìn)行介紹。
(9)特征點(diǎn)特征。早在1957年,Solatron Electronics Group公司發(fā)布了第一個(gè)利用窺視孔(peephole)方法的OCR系統(tǒng)。其主要思想是利用字符點(diǎn)陣中一些有代表性的黑點(diǎn)(筆劃),白點(diǎn)(背景)作為特征來(lái)區(qū)分不同的字符。后有人又將這種方法運(yùn)用到漢字識(shí)別中,對(duì)其中的黑點(diǎn)又增加了屬性的描述,如端點(diǎn)、折點(diǎn)、交叉點(diǎn)等。也獲得了比較好的效果。其特點(diǎn)是對(duì)于內(nèi)部筆劃粘連的字符的識(shí)別的適應(yīng)性較強(qiáng),直觀性好,但是不易表示為矢量形式,不適合作為粗分類的特征,匹配難度大。
當(dāng)然還有許多種不同的統(tǒng)計(jì)特征,諸如圖描述法、包含配選法、脫殼透視法、差筆劃法等,這里就不一一介紹了。
統(tǒng)計(jì)識(shí)別與結(jié)構(gòu)識(shí)別的結(jié)合
結(jié)構(gòu)模式識(shí)別與統(tǒng)計(jì)模式識(shí)別各有優(yōu)缺點(diǎn),隨著我們對(duì)于兩種方法認(rèn)識(shí)的深入,這兩種方法正在逐漸融合。網(wǎng)格化特征就是這種結(jié)合的產(chǎn)物。字符圖象被均勻地或非均勻地劃分為若干區(qū)域,稱之為“網(wǎng)格”。在每一個(gè)網(wǎng)格內(nèi)尋找各種特征,如筆劃點(diǎn)與背景點(diǎn)的比例,交叉點(diǎn)、筆劃端點(diǎn)的個(gè)數(shù),細(xì)化后的筆劃的長(zhǎng)度、網(wǎng)格部分的筆劃密度等等。特征的統(tǒng)計(jì)以網(wǎng)格為單位,即使個(gè)別點(diǎn)的統(tǒng)計(jì)有誤差也不會(huì)造成大的影響,增強(qiáng)了特征的抗干擾性。這種方法正得到日益廣泛的應(yīng)用。
人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,以下稱ANN)是一種模擬人腦神經(jīng)元細(xì)胞的網(wǎng)絡(luò)結(jié)構(gòu),它是由大量簡(jiǎn)單的基本元件-神經(jīng)元相互連接成的自適應(yīng)非線性動(dòng)態(tài)系統(tǒng)。雖然目前對(duì)于人腦神經(jīng)元的研究還很不完善,我們無(wú)法確定ANN的工作方式是否與人腦神經(jīng)元的運(yùn)作方式相同,但是ANN正在吸引著越來(lái)越多的注意力。
ANN中的各個(gè)神經(jīng)元的結(jié)構(gòu)與功能較為簡(jiǎn)單,但大量的簡(jiǎn)單神經(jīng)元的組合卻可以非常復(fù)雜,我們從而可以通過(guò)調(diào)整神經(jīng)元間的連接系數(shù)完成分類、識(shí)別等復(fù)雜的功能。ANN還具有一定的自適應(yīng)的學(xué)習(xí)與組織能力,組成網(wǎng)絡(luò)的各個(gè)“細(xì)胞”可以并行工作,并可以通過(guò)調(diào)整“細(xì)胞”間的連接系數(shù)完成分類、識(shí)別等復(fù)雜的功能。這是馮·諾依曼的計(jì)算機(jī)無(wú)法做到的。
ANN可以作為單純的分類器(不包含特征提取,選擇),也可以用作功能完善的分類器。在英文字母與數(shù)字的識(shí)別等類別數(shù)目較少的分類問(wèn)題中,常常將字符的圖象點(diǎn)陣直接作為神經(jīng)網(wǎng)絡(luò)的輸入。不同于傳統(tǒng)的模式識(shí)別方法,在這種情況下,神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無(wú)明顯的物理含義,而是儲(chǔ)存在神經(jīng)物理中各個(gè)神經(jīng)元的連接之中,省去了由人來(lái)決定特征提取的方法與實(shí)現(xiàn)過(guò)程。從這個(gè)意義上來(lái)說(shuō),ANN提供了一種“字符自動(dòng)識(shí)別”的可能性。此外,ANN分類器是一種非線性的分類器,它可以提供我們很難想象到的復(fù)雜的類間分界面,這也為復(fù)雜分類問(wèn)題的解決提供了一種可能的解決方式。
目前,在對(duì)于象漢字識(shí)別這樣超多類的分類問(wèn)題,ANN的規(guī)模會(huì)很大,結(jié)構(gòu)也很復(fù)雜,現(xiàn)在還遠(yuǎn)未達(dá)到實(shí)用的程度。其中的原因很多,主要的原因還在于我們對(duì)人腦的工作方式以及ANN本身的許多問(wèn)題還沒(méi)有找到完美的答案。
【點(diǎn)擊查看更多精彩內(nèi)容】
相關(guān)新聞:
塑膠記憶印刷體預(yù)計(jì)2010年可望進(jìn)入市場(chǎng)
紅樓夢(mèng)印刷體祖本212.8萬(wàn)元人民幣成交(圖)
全國(guó)首部印刷體“工尺譜”出版發(fā)行
- 關(guān)于我們|聯(lián)系方式|誠(chéng)聘英才|幫助中心|意見(jiàn)反饋|版權(quán)聲明|媒體秀|渠道代理
- 滬ICP備18018458號(hào)-3法律支持:上海市富蘭德林律師事務(wù)所
- Copyright © 2019上海印搜文化傳媒股份有限公司 電話:18816622098