目标
利用图像处理技术,通过水色图像实现水质的自动评价
分析方法与过程
需要对图像提取特征,图像特征提取的效果直接影响到图像的识别和分类的好坏。
图像特征主要包括颜色特征,纹理特征,形状特征和空间关系特征。与几何特征相比,颜色特征更为稳健,对于物体的大小和方向均不敏感,表现出较强的鲁棒性。本案例中水色图像是均匀的,故主要关注颜色特征。
利用图像的颜色特征进行图像处理识别分类的研究中,主要方法有直方图法和颜色矩方法。
数据预处理
1、图像切割
只选取原始图片中中间固定大小的图像
2、特征处理
本例使用颜色矩来提取水样图像的特征。
(1)一阶颜色矩
一阶颜色矩采用一阶原点矩,反应图像的整体明暗程度
Ei是在第i个颜色通道的一阶颜色矩,pij是第j个像素的第i个颜色通道的颜色矩。
(2)二阶颜色矩
采用的是二阶中心距的平方根,反应图像颜色的分布范围
σi是在第i个颜色通道的二阶颜色矩。
(3)三阶颜色矩
采用的是三阶中心距的立方根,反应图像颜色分布的对称性。
彩色的图像一共有3个颜色通道,这样我们就可以从每张图片中提取9个特征。
模型构建
本案例采用支持向量机作为水质评价分类模型。
想看下样本数据,9个特征值的取值都在[-1, 1]间,水质类别有5种。征值的取值都比较小,如果直接输入SVM模型的话,彼此之间的区分度会比较小。因此,不妨将所有特征都统一乘以一个适当的常数k,从而提高区分度和准确率。
常数k的选取不能过大也不能过小,过小导致区分度低,过大则容易过拟合。比如k=1000时,在训练集上的准确率是100%,在测试集上的准确率是20%。k的确定需要通过反复的测试确定。