《纯干货》吊炸天的CNNs，这是我见过最详尽的图解！（上）

0关注
1粉丝

小学生

50%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 20 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 146 点
帖子: 3
精华: 0
在线时间: 11 小时
注册时间: 2017-4-6
最后登录: 2018-1-4

楼主

beibeiAI 发表于 2017-10-9 12:25:33 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

简书.png

原文链接：

https://mp.weixin.qq.com/s/x6NIkzQSgvl0_rfGe7Cjqg

文章搬得好辛苦，很多图片，如果对你的学习有帮助，欢迎点赞和留言。
感谢大家，同时，感谢原作者。

导读：卷积神经网络（CNNs）在“自动驾驶”、“人脸识别”、“医疗影像诊断”等领域，都发挥着巨大的作用。这一无比强大的算法，唤起了很多人的好奇心。当阿尔法狗战胜了李世石和柯杰后，人们都在谈论“它”。

但是，

“它”是谁？
“它”是怎样做到的？

已经成为每一个初入人工智能——特别是图像识别领域的朋友，都渴望探究的秘密。

本文通过“算法可视化”的方法，将卷积神经网络的原理，呈献给大家。教程分为上、下两个部分，通篇长度不超过7000字，没有复杂的数学公式，希望你读得畅快。

下面，我们就开始吧！

先提一个小问题：

“你是通过什么了解这个世界的？”

当一辆汽车从你身边疾驰而过，你是通过哪些信息知道那是一辆汽车？

“它的材质，速度，发动机的声响，还是什么？”

你可能说不清所以然，但是当你看到下图时，你会第一时间反应出来，“噢，车！ ”

2汽车轮廓.jpg

为什么你能猜对它？

“轮廓”！

——对，我给你看了它的轮廓。

再给你一些七七八八、大小不一的图片，你总能猜对一些。

你是怎样做到的？

很简单

你读了一张图片 → 找到了图片的特征 → 进而对图片做出了分类

2017-10-9 12:13:29 上传
下载附件 (156.22 KB)

其实，CNNs的工作原理也是这样。

先不考虑那些复杂的专有名词：什么卷积（convolution）、池化（pooling）、过滤器（filter）等等…… 统统抛到一边。

CNNs做的就是下面3件事：

1. 读取图片；
2. 提取特征；
3. 图片分类。

下面，我们逐一来看各步骤的细节。

如果是一张黑白图片，我们看到的，是这个样子的：

dog-黑白.jpg

而在计算机的眼里，它看到的，是这个样子的：

7dog-黑白-像素.jpg

好没有情趣……

无奈.jpg

这些数字是哪里来的？

因为图片是由一个又一个的像素点构成。（当你将图片无限放大，你能看到那些像素点）

8dog-黑白-像素点.jpg

而每一个像素点，都是由一个0~255的数字组成。

9dog-黑白-像素值构成.jpg

所以，在计算机“看”来，一张图片，就是一个又一个的数字。

10对比.jpg

所以，我们第一步的工作，是将左上图的那只小狗，转换成右上图的那一行行数字。

幸运的是，目前在python中，很多第三方库，诸如PIL/Matplotlib等，都可以实现这种转换，我们需要了解的是，后面的所有运算过程，都是基于右上图来完成的，至于具体的转换过程，不需要我们费心来做。

5步骤2.jpg

在文章开篇的例子中，我们知道，在识别一辆汽车的时候，可以将它的轮廓提取出来，从而判断出那是一辆车。

同样的，CNNs在识别图片时，也需要提取图像的特征。

在CNNs中，完成这一工作的小伙叫“卷积”。（希望你不要纠结这个极具个性的名字，懂得它的原理就OK）

“卷积”在每次工作时，手里都会握着几把“过滤器”。

12卷积小伙儿.jpg

过滤器的作用是：寻找图片的特征。

仍以小狗为例，过滤器会在图片上从头到尾“滑过”一遍

13小狗过滤器-动图.gif

每滑到一个地方，就将该地方的图像特征提取出来。

那它是怎样提取的呢？

别忘了，在计算机的眼里，世界是这个样子的：

（为了简化问题，这里将像素值仅用0和1表示）

假设过滤器是这个样子的：

当橘色的过滤器在绿色矩形框中，缓慢滑过时，

我们用橘色过滤器中的每一个值，与绿色矩形框中的对应值相乘、再相加

有点儿拗口，直接看图：

结果“4”，就是我们从第一个橘色方框中，提取出的特征。

如果我们每次将橘色过滤器，向右、向下移动1格，则提取出的特征为：

17过滤器-动画.gif

你可能会问：

我知道绿色矩阵代表一张图片，是计算机“眼中”图片的样子。

但是，
经过橘色过滤器提取特征后，得到的粉色矩阵，那是什么？

2017-10-9 12:13:33 上传
下载附件 (49.06 KB)

我们从人类的视角，再重新审视一遍。

这次，我们回到之前的例子中。

仍以这张萌狗为例，它经过“过滤器”提取特征后，得到的是一张……哦，好吧……看起来有点儿模糊的图。

19过滤器-模糊.png

虽然图片模糊了，但是图片中的主要特征，已经被过滤器全部提取出来，单凭这么一张模糊的图，作为人类的我们，足以对它做出判断了。（谁敢说它是一只猫？！）

下面，我们再换几个过滤器试试。

20过滤器-不同效果.jpg

这些就是经过过滤器提取后，得到的不同“特征图片”。

由此我们可以看出，采用不同的“过滤器”，能够提取出不同的图片特征。

你可能又会问：

那过滤器里的数值，该如何确定呢？

。。。。。论坛字数限制，不让我发了，等哪天有时间，我再开一帖吧。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏6 回帖

关键词：机器学习人工智能图像识别 CNN 卷积神经网络

6步骤3.jpg (54.67 KB)

6步骤3.jpg

4种过滤器-效果.png (116.6 KB)

4种过滤器-效果.png

4种过滤器.png (21.42 KB)

4种过滤器.png

dog-黑白.jpg (41.25 KB)

dog-黑白.jpg

《纯干货》吊炸天的CNNs，这是我见过最详尽的图解！（上） [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

《纯干货》 吊炸天的CNNs，这是我见过最详尽的图解！（上） [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

《纯干货》吊炸天的CNNs，这是我见过最详尽的图解！（上） [推广有奖]

扫码加我拉你入群