一種基于SVM的數(shù)字儀表顯示值識別方法
數(shù)字儀表結構簡單,使用方便,已廣泛應用于科學實驗和生產(chǎn)中。為了提高檢定效率、檢定精度,實現(xiàn)自動化檢定是十分必要的。由于數(shù)字儀表的檢定是一項大批量、重復性的檢測過程,其操作過程簡單、規(guī)范,外界環(huán)境要求不高,這為其實現(xiàn)檢定自動化提供了有利條件。近年來計算機視覺技術和數(shù)字圖像處理技術的不斷發(fā)展,為滿足上述要求提供了可能。利用攝像機完成表盤及背景圖像的采集,并將其轉換成數(shù)字信號,然后利用數(shù)字圖像處理技術實現(xiàn)關鍵操作,實現(xiàn)數(shù)字儀表的自動檢定,提高了檢定精度、生產(chǎn)效率、降低了生產(chǎn)成本。本文開發(fā)的儀表顯示值自動實時識別系統(tǒng)主要包括:圖像預處理、特征提取和數(shù)字識別3部分。其中數(shù)字識別是關鍵一環(huán),主要采用了學習理論中的支持向量機方法。學習理論是一種研究有限樣本情況下機器學習性質和規(guī)律的理論。在這一理論下發(fā)展出的一種通用的模式分類器——支持向量機,由于與傳統(tǒng)的模式識別方法相比,具有推廣能力強,能保證全局最優(yōu)等優(yōu)點,這使得支持向量機技術在數(shù)字識別系統(tǒng)中有很好的應用前景,因而引起了國內外學者的極大興趣。支持向量機通過結構風險最小化準則和核函數(shù)方法,較好地解決了模式分類器復雜性與推廣性之間的矛盾,因而也引起了模式識別領域學者的極大關注。
1 儀表示值自動識別原理
儀表顯示值自動實時識別系統(tǒng)的流程:首先,由攝像頭獲取儀表顯示的視頻幀;然后,將視頻幀進行灰度變換,二值化得到二值圖像;再通過邊緣檢測,操作微分直方圖,計算表盤水平和垂直投影,進行峰谷分析定位出數(shù)字區(qū)域,并切分出單個數(shù)字的二值圖像;對單個數(shù)字的圖像進行特征提取,得到一組特征;最后,將特征送入識別器進行識別。
1.1 預處理
數(shù)字儀表在檢定過程中,首先要定位表盤區(qū)域,然后確定數(shù)字位置。攝像頭提取圖像后,經(jīng)過灰度變換(見圖1)和二值化(見圖2),其效果將對后續(xù)的數(shù)字切分和特征提取產(chǎn)生直接的影響,其中二值化是圖像預處理的關鍵環(huán)節(jié),在實際應用中受室內燈光及儀表屏幕自身亮度等因素影響,圖像中往往存在灰度分布不均和灰度突變的情況。本文采用了OTSU算法,根據(jù)最大方差二值化獲得良好的二值圖像,這里主要為了提取表盤區(qū)域。通過標識連通區(qū)域,連通區(qū)域的外接矩形,然后根據(jù)外接矩形的長與寬定位數(shù)字儀表的顯示區(qū)域。本文采用了一個8連通區(qū)域提取算法。首先按照一定的標號規(guī)則掃描圖像,得到一定數(shù)量的連通區(qū)域;然后針對同一區(qū)域內標號不一致的情況進行處理,即得到最終處理結果。
1.2 數(shù)字分割
表盤區(qū)域分割之后,繼續(xù)分割數(shù)字區(qū)域。在實際應用中,攝像頭是固定的,數(shù)字的顯示區(qū)域在圖像中的位置、大小等是基本相似的。本文根據(jù)數(shù)字儀表顯示屏幕的特點,采用投影法找到顯示屏的邊框。圖像中數(shù)字區(qū)域的準確定位分割是實現(xiàn)儀表顯示值識別的重要前提。在表盤的二值圖內,先通過邊緣檢測,利用微分直方圖進行數(shù)字分割,圖3為水平投影后的直方圖。
經(jīng)過水平投影將圖像分割成上、中、下3部分。對中部數(shù)字區(qū)域的二值圖像從上到下逐行掃描;獲取到圖像的水平投影圖。利用行間間隔形成的水平投影間隙,即可將各數(shù)字行分割開來,如圖4所示,然后提取中部截圖,再對中部數(shù)字區(qū)域做垂直投影,如圖5所示,計算峰谷可以將單個數(shù)字分割出來。字切割是從行切分后,得到的圖像中將每一個數(shù)字分割出來,利用每行字符的垂直投影中字符之間的間隙即可將各個數(shù)字分割出來。
評論