在神经网络的基础上,卷积神经网络(是如何完成图像识别任务的?本文介绍了其相关基本原理,起来看看吧。 上文介绍了神经网络的基础概念,今天我们在神经网络的基础上,看看卷积神经网络(是如何完成图像识别任务的。
图像识别的痛点问题 在出现之前
图像识别有两个大难题: 图像需要处理的数据量太大:图片是由像素构成的,每个像素又由颜色(、、三个数值构成,用的手机摄像头随 VK数据库 便拍张照片,就是=.万个参数,计算量无疑是巨大的。 图片内容多变,导致准确率不高:如果对同物体做翻转、位置变换等处理,使物体以不同的姿态显示在图片中,虽然物体本身并没有太大变化,但却大大提升了图片识别的难度。 而可以有效的解决这两个问题,它不仅可以大幅减少参数数量,降低复杂度;还可以使用类似视觉处理的方式保留图像特征,即使图像翻转、移动,也可以进行有效的识别。
人类的视觉原理 要理解的原理,需要先了解人类的视觉原理。 人类判断物体的大致过程:眼睛看到物体(瞳孔摄入像素,然后发现物体的边缘和方向(初步处理,接着判断物体的形状(抽象、最后根据形状判定是什么物体(进步抽象。
我们可以发现
上述过程其实就是个神经网络,低层级负责识别图像基础特征,多个基础特征整合后变成上层的特征,逐层处理,最终在顶层判断出是什么物体。 这就是 这是一个充满挑战的旅程,但是 的基础思路。 三、的基本原理 由卷积层、池化层、全连接层三部分构成,它们各自的作用如下: 卷积层:卷积层负责提取图像中的局部特征。 池化层:池化层负责大幅降低参数量级,在保留重要特征信息的同时,降低计算复杂度。 全连接层( :全连接层类似传统神经网络的作用,根据卷积层和池化层处理过的数据,计算出最终的结果。
我们先来看看卷积层
特征的过程,和人类视觉的提取特征类似,如下 ca 手机号码所 图所示: 图中的黄色部分是个滤波器(,我们称它为卷积核,它是个小的矩阵。 卷积核通过滑动窗口的方式在输入数据上进行卷积操作,卷积核的每个元素与输入数据对应位置的元素相乘,然后将所有乘积结果相加,得到卷积操作的输出结果。 不同的卷积核可以捕捉到不同的特征,例如边缘、纹理、形状等。