摘要:摘要:為了提高植物種類的識別率,采用葉片圖像算法。首先建立植物種類特征模型,包括植物葉片顏色特征、形狀特征、紋理特征;然后確定徑向基函數神經網絡的輸入層、輸出層、隱
摘要:為了提高植物種類的識別率,采用葉片圖像算法。首先建立植物種類特征模型,包括植物葉片顏色特征、形狀特征、紋理特征;然后確定徑向基函數神經網絡的輸入層、輸出層、隱含層之間的關系;接著對徑向基函數個數、中心及寬度優化,基于梯度下降方法對權重參數計算,自適應調節學習率;最后給出了植物種類識別過程。實驗仿真選擇植物葉片顏色特征、形狀特征、紋理特征的特征量分別為6、7、7個,其中本文算法對植物種類識別的三個組合特征平均識別率為93.5%,高于單個特征、兩個組合特征的平均識別率,形狀特征對識別率所起的作用最大。
關鍵詞:葉片;植物種類;徑向基函數;圖像算法
植物種類識別一般是通過對植物的外部形態描述得以實現,各種植物葉片的紋理、顏色和形狀結構具有差異性,同時植物葉片一年四季變化不大,比較容易采集,因此利用葉片通過人工智能方法進行植物種類識別是一種簡單而有效的方法[1],對植物可進行方便的管理和保護。
傳統人工識別結果受主觀性影響比較大,正確識別率較低,目前智能算法主要有:Guyer等[2]提取了17種葉片形狀特征,并對40類植物進行分類;Oide等[3]將葉片形狀作為神經網絡的輸入,使用Hopfield網絡和感知器對大豆葉片進行分類;Soderkvist[4]使用葉片的幾何特征,采用BP前饋神經網絡對15種瑞典樹木進行分類,最終形成Swedish葉片標準測試數據集;Backes等[5]利用復雜網絡算法分析葉片特征并進行識別,可對不同分辨率以及一定采樣噪聲的葉片圖像識別,有很好的效果;Ghazi等[6]利用PCANet算法在掃描葉片圖像上取得了90.49%的識別率,但是普通葉片圖像識別率比較低;朱靜等[7]通過葉片圖像的形狀和葉緣特征,對14種植物337份葉片樣本的葉形測試準確率達92%;Munisami等[8]采用基于特征的神經網絡分類器對植物葉片識別,包括矩形、圓度、偏心率等;Lee等[9]提出了基于葉片輪廓質心的植物葉片識別系統,使用4種基本幾何特征和5個靜脈特征。
為了提高植物種類的識別率,采用改進徑向基函數神經網絡(improvedradialbasisfunctionneuralnetwork,IRBFNN)算法。首先建立植物種類特征模型,包括植物葉片顏色特征、形狀特征、紋理特征;然后確定徑向基函數神經網絡的輸入層、輸出層、隱含層之間的關系;接著對徑向基函數個數、中心及寬度優化,基于梯度下降方法對權重參數計算,自適應調節學習率;最后給出了植物種類識別過程。實驗仿真選擇植物葉片顏色特征、形狀特征、紋理特征的特征量分別為6、7、7個,其中本文算法對植物種類識別的3個組合特征平均識別率為93.5%,高于單個特征、兩個組合特征的平均識別率,形狀特征對識別率所起的作用最大。
1植物種類特征
1.1植物葉片顏色特征顏色信息集中分布在一階顏色矩、二階顏色矩和三階顏色矩上[10],通過低階顏色矩分別描述顏色的平均值、方差和斜度:

其中:M1、M2、M3分別表示一、二、三階顏色矩;qkl表示第k個顏色通道中灰度為l的像素值出現的概率;N表示圖像中像素值總個數。由于HSI顏色模型中,只有H和S分量中包含顏色信息,因此提取H和S顏色分量圖像的一、二、三階顏色矩作為葉片圖像的顏色特征,則葉片圖像的顏色特征M=M1H,M2H,M3H,M1S,M2S,M3[]S。
1.2形狀特征形狀特征是葉片的主要特征[11],主要羅列如下:

1.3紋理特征1.3.1分形特征葉片圖像的紋理主要由葉片角質層的固有紋理和葉脈紋理構成,同時主葉脈和延伸的葉脈組成具有一定自相似性的網狀結構,符合分形特征[12],主要采用自相似性特征以及縫隙量兩個特征。描述對象不規則度的自相似性特征:

其中:k為常數;r為尺度;F為分形維數;kλ2-F為分形表面積。描述紋理的疏密程度的縫隙量:f2=E[](M/E(M)-1)2。其中:M為分形體質量;E(M)為期望值。1.3.2基于灰度共生矩陣的特征在進行植物葉片分析和處理過程中,紋理特征也是重要特征之一[13],利用灰度共生矩陣的統計特性生成0°、45°、90°、135°四個方向的共生矩陣,分別計算四個方向的特征如下。同質性T1平均值:

其中:i、j為灰度值;p(i,j)為灰度值(i,j)同時出現的概率;L為灰度等級。對比度T2平均值:

2改進徑向基函數神經網絡算法
2.1徑向基函數神經網絡徑向基函數(radialbasisfunction,RBF)神經網絡在逼近能力和學習速度等方面都優于BP神經網絡[16]。輸入層是用來接受數據的,隱含層是一個非線性函數,對輸入數據進行建模,輸出層作為數據的輸出。

2.2改進模型2.2.1徑向基函數個數、中心及寬度初始化方法改進徑向基函數神經網絡(improvedradialbasisfunctionneuralnetwork,IRBFNN)算法,隱含層結點數少量冗余能夠提高RBF的泛化能力[17],通過聚類方法求得隱結點基數,適當增加冗余,得到最佳隱結點數。設M為隱結點數;J為樣本原始聚類數;β為冗余系數,則:M=(1+β)·J。其中:β一般取值范圍為[0,0.5],本文取值0.35。為提高RBF訓練速度,參數Cj、Dj需要初始化。
總結本文算法對徑向基函數個數、權重、學習率進行了調整,使得IRBFNN算法對植物種類的平均識別率較高,實驗仿真顯示本文算法對植物種類的三個組合特征平均識別率高于單個特征、兩個組合特征,形狀特征對識別率貢獻最大,因此以后研究可增加植物葉片形狀特征的數量,對提高植物種類識別率會有一定的幫助。