理论研究:基于柑橘溃疡病的新型智能分拣系统的研究(2)
·数据清洗:检查是否有重复文件名或标注结果,是否有缺失值或无效值。
·数据集成:将来自不同源的数据整合到一个数据集中。
·图像去噪、图像增强、图像分割:对每张图像进行预处理,以便进行后续的标注和分析。
·标注数据清洗:检查标注结果是否有错误标注或重复标注等异常值。
·标注数据变换:将标注结果进行数据格式转换,以便进行后续的模型训练和智能标注。
·标注数据标准化:将标注结果进行标准化处理,便于进行后续的统计分析和建模。
(二)智能标注技术
本作品利用深度学习模型对正常柑橘与患病柑橘的图像进行训练,从而实现对图像的自动标注,提高标注速度和准确性。并结合图像分割技术和计算机视觉技术,从柑橘溃疡病图像中提取出有用的特征,如形态学特征、颜色特征、纹理特征等,将柑橘溃疡病图像中的溃疡区域与健康区域进行分割,提高溃疡的检测准确性和图像识别的正确性。
1、K-means聚类算法:
K -means聚类算法可将复杂背景下多果图像处理成二值区域图像和彩色区域图像﹐能够完整﹑清晰地分割出目标轮廓﹐为目标轮廓的边缘检测提供有效保障。K -means聚类算法的原理是通过迭代过程把原始图像的像素数据集划分为不同的类别﹐使得评价聚类性能的准则函数达到最优﹐生成的每个聚类(又称簇)类内紧凑﹑类间独立。
平均误差准则函数是常用的聚类准则函数﹐其定义为:
式中,E为平均误差;P为橘子图像中像素点的像素值 ;m,为橘子图像中簇C,的像素值的平均值;C,为橘子图像中第j个像素聚类;k为像素点聚类的数目。
2、Tensorflow卷积神经网络构造模型(见下图):
通常由多个卷积层、池化层、全连接层以及输出层构成。卷积核定义为 3×3,共16个。每隔5 000步取一次模型。在卷积层用于提取图像的特征。
卷积层通过卷积运算将输入数据映射到新的特征空间中,每个卷积核对应一一个输出特征图,每个输出特征图包含多个特征。在池化层用于缩小特征图的尺寸,同时保留特征图的重要信息。
池化层通常有两种类型:最大池化和平均池化。最大池化将每个特征图分成若千个区域,取每个区域中的最大值作为输出;平均池化将每个特征图分成若干个区域,取每个区域中的平均值作为输出。
在连接层中,首先把卷积过的多维tensor拉平成二维的张量(就是矩阵)。其次连接神经元,计算标准差。最后矩阵 相乘再加上标准差。
在整个训练过程中,因为采用batch训练法,所以需要先 定义队列来存放。
3、柑橘非静止状态下捕捉:
基于OpenCV的动态捕捉(部分代码见附录3):
取图像中不连续部分的特征,以闭合边缘为基准,对区域进行确定。而在区域划分上,则是将影像分割成同一特征的区域,区际界线即为边缘。由于边缘侦测方法不需要逐个像素点分割图像,所以对于大图像的分割比较合适。当灰度数值出现明显的跳变情况时,这样做的点的灰度数值变得非常大。可以判断柑橘表面的损坏程度从而进一步判断柑橘的优劣程度。边缘检测使数据量大大减少,可以认为不相关的信息被剔除,对于柑橘来说保留了重要的表面结构属性。
该部分将应对柑橘非静态下,传送带对于柑橘的传送使其更好更快速的地获取柑橘图片,(其中灰阶每个像素点只需一个字节储存灰阶值强度值值),灰阶范围为0-255,且灰阶影像通常测量每个像素点在单个电磁波频谱(如可见光)内的亮度所得。用于显示的灰度图像通常会被保存在每个像素8位的非线性标尺上,使其能够拥有256级的灰度。这样的精度刚好可以避免可见的条带失真,而且编程起来非常方便。高斯模糊∶在图像处理中,卷积操作是指利用一个卷积核(Kernel)对一张图像中的每一个像素进行一系列的操作。平滑噪声和边缘增强是缺陷检测的一项重要预处理操作,布置时应尽量靠近成像的感应器侧。检测系统最有效的除噪方法是使图像尽可能清晰,通过一些可行的工程措施。即该功能需与良好硬件相适配,用于良好去噪。