📜  什么是计算机视觉中的卷积

📅  最后修改于: 2022-05-13 01:56:17.581000             🧑  作者: Mango

什么是计算机视觉中的卷积

在本文中,我们将了解什么是计算机视觉中的卷积。

卷积过程

我们将看一个基本的例子来理解卷积的过程

这两条可怜的蛇互相打架,但你有没有想过我们人类经常这样做?想一次?

让我们先将人类视觉与计算机视觉进行比较,然后平静地思考一下。

比较人类视觉和计算机视觉

你还记得在我们的童年时代,我们被教导一边指出水果,一边想象像“A”代表苹果,“B”代表球等等……如果你看到这个,我们的眼睛会与不同的物体产生卷积通过可视化和存储苹果在我们大脑中的样子的信息,这些信息被称为简单单词的卷积。

就像您没有看到物体一样,这意味着您没有通过卷积来识别或分类周围环境。

您是否有时认为,作为人类,我们在某些时候并没有那么重视物体的颜色,而是专注于物体的形状、大小和纹理以了解它的外观,这就是为什么如果您看到绿色,红色,黄色-红色的苹果你仍然可以理解它是一个苹果,因为你可以区分苹果、芒果等不同物体的形状、大小和质地。

如果我们只关注可能会提供错误信息的颜色,比如苹果总是红色的,等等……你明白了吗!!!!但没关系,颜色根本不重要,但我们首先关注形状、大小和纹理,以便更好地理解,因为同一个物体可能有不同的颜色,这可能会在某些时候让我们的大脑感到困惑。

如果你想购买财富公司的成品油,那么你的表现如何:我们的大脑中已经储存了财富包是什么样的信息,你会挑选每一个成品油包,然后在到达后阅读名称知道哦,伙计,这不是幸运的(我们作为人类的行为不是这样)相反,我们的眼睛专注于提取寻找的物品(幸运精炼油),我们已经在大脑中存储了信息,所以:简单来说,我们会立即从一个机架跳到另一个机架,以找到正在寻找的特定产品,简单来说,您正在借助已存储的信息根据特定的油来处理不同的项目,并立即提取正确的信息,因此知道作为卷积(人类生活的重要方面之一)。

现在让我们把它提升到一个新的水平,

考虑上面的图像,你可以毫无问题地看到大象、狗、猫和驴,认为它就像正常的人类视觉,但如果我告诉你这张图像中有 15 种以上的动物,你会感到困惑吗?

好吧,现在要弄清楚它,而不是解决这个谜题,试着理解你的大脑现在正在遵循的过程,让我们分析一下。

首先,我们试图查看这些动物的边缘,以防它们是否正在建造任何其他动物,例如,如果您分析大象的躯干(鼻子)边缘正在建造一条鱼,但您是否注意到它第一手?没有权利

现在分析更多,您将在下图中看到所有这些动物

好吧,到目前为止,我们一直试图将人类视觉和计算机视觉之间的点联系起来,但是把计算机视觉放在一边,想想人类视觉,我们不是先应用一个卷积层来提取动物的边缘来构建形状与我们在卷积神经网络中所做的相同。假设你正在进入一个你从未见过的房间,你是直接跳到你想去的地方,还是先分析一下房间里的小物件,然后到达你想去的地方。

另一个例子是,当您穿过一条充满车流的繁忙道路时,您不会首先注意到每辆车。

好吧,由于卷积神经网络从数据中学习,它们遵循相同的步骤,首先,它们尝试分析最小的组件,即边缘,并了解对象的基本构建,正如我们所知,开始卷积层首先提取边缘和梯度,然后图案、对象的部分,最后是完整的对象出现在图片中。既然我们已经清楚地了解了我们手中的视觉过程,那么让我们谈谈一些有趣的事情。

“卷积运算的重要性与人的水一样”

在孩子只有几个月大的童年时期,他们永远不会像我们那样想象物体。小孩子只能看到周围的一些边缘和图案,这就是孩子们在婴儿时期经常哭泣的原因之一。他们看到不同物体的模糊形状,甚至科学说他们的视力只有 20/200 到 20/400 之间。你有没有想过那里发生了什么,它们是卷积的东西,你可以将早期的年龄视为开始卷积层。