基于聚类的烟叶近红外光谱有效特征的筛选方法
Tobacco Leaf Selection Method of the Near-infrared Spectroscopy Effective Feature Based on the Cluster
-
摘要: 提出利用聚类方法对光谱数据进行特征筛选。通过分析类内参数γ1和类间参数γ2对筛选结果的影响,选择较好的γ1和γ2进行有用光谱特征筛选。利用烤烟叶的近红外反射光谱(1500~2400 nm间隔2 nm),选用SVM方法进行部位和颜色分组识别,训练样本的识别率为100%,测试样本的识别率分别是96.22%和92.79%。然后利用聚类方法对初始光谱进行特征筛选,选用相同的 SVM 方法及相同的学习样本和测试样本进行部位和颜色分组识别。在删减部分不相干光谱后,识别率分别提高到97.23%和95.52%;继续删除相关度不高的光谱,在识别率略有下降时,光谱特征数可减少到200个以下。结果表明:利用聚类方法进行特征筛选,不仅可提高识别率,且可大大减少光谱数据,因而极大地减少了数据采集时间,简化了分组模型,提高了系统的实时和快速处理能力。