楼主: beibeiAI
6472 6

《纯干货》 吊炸天的CNNs,这是我见过最详尽的图解!(上) [推广有奖]

  • 0关注
  • 1粉丝

小学生

50%

还不是VIP/贵宾

-

威望
0
论坛币
20 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
146 点
帖子
3
精华
0
在线时间
11 小时
注册时间
2017-4-6
最后登录
2018-1-4

楼主
beibeiAI 发表于 2017-10-9 12:25:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

简书.png


原文链接:

https://mp.weixin.qq.com/s/x6NIkzQSgvl0_rfGe7Cjqg




文章搬得好辛苦,很多图片,如果对你的学习有帮助,欢迎点赞留言
感谢大家,同时,感谢原作者。


导读:卷积神经网络(CNNs)在“自动驾驶”、“人脸识别”、“医疗影像诊断”等领域,都发挥着巨大的作用。这一无比强大的算法,唤起了很多人的好奇心。当阿尔法狗战胜了李世石和柯杰后,人们都在谈论“它”。


但是,

“它”是谁?
“它”是怎样做到的?

已经成为每一个初入人工智能——特别是图像识别领域的朋友,都渴望探究的秘密。


本文通过“算法可视化”的方法,将卷积神经网络的原理,呈献给大家。教程分为上、下两个部分,通篇长度不超过7000字,没有复杂的数学公式,希望你读得畅快。


下面,我们就开始吧!





先提一个小问题:

“你是通过什么了解这个世界的?”


当一辆汽车从你身边疾驰而过,你是通过哪些信息知道那是一辆汽车?

“它的材质,速度,发动机的声响,还是什么?”

你可能说不清所以然,但是当你看到下图时,你会第一时间反应出来,“噢,车! ”

2汽车轮廓.jpg


为什么你能猜对它?

“轮廓”!

——对,我给你看了它的轮廓。


再给你一些七七八八、大小不一的图片,你总能猜对一些。


你是怎样做到的?


很简单

你读了一张图片 → 找到了图片的特征 → 进而对图片做出了分类

3人类识别物体流程.jpg




其实,CNNs的工作原理也是这样。


先不考虑那些复杂的专有名词:什么卷积(convolution)、池化(pooling)、过滤器(filter) 等等…… 统统抛到一边。


CNNs做的就是下面3件事:

1. 读取图片;
2. 提取特征;
3. 图片分类。

下面,我们逐一来看各步骤的细节。

4步骤1.jpg


如果是一张黑白图片,我们看到的,是这个样子的:

dog-黑白.jpg



而在计算机的眼里,它看到的,是这个样子的:

7dog-黑白-像素.jpg





好没有情趣……

无奈.jpg



这些数字是哪里来的?


因为图片是由一个又一个的像素点构成。(当你将图片无限放大,你能看到那些像素点)

8dog-黑白-像素点.jpg




而每一个像素点,都是由一个0~255的数字组成。


9dog-黑白-像素值构成.jpg




所以,在计算机“看”来,一张图片,就是一个又一个的数字。

10对比.jpg


所以,我们第一步的工作,是将左上图的那只小狗,转换成右上图的那一行行数字。


幸运的是,目前在python中,很多第三方库,诸如PIL/Matplotlib等,都可以实现这种转换,我们需要了解的是,后面的所有运算过程,都是基于右上图来完成的,至于具体的转换过程,不需要我们费心来做。



5步骤2.jpg

在文章开篇的例子中,我们知道,在识别一辆汽车的时候,可以将它的轮廓提取出来,从而判断出那是一辆车。


同样的,CNNs在识别图片时,也需要提取图像的特征。


在CNNs中,完成这一工作的小伙叫“卷积”。(希望你不要纠结这个极具个性的名字,懂得它的原理就OK)


“卷积”在每次工作时,手里都会握着几把“过滤器”。


12卷积小伙儿.jpg



过滤器的作用是:寻找图片的特征。


仍以小狗为例,过滤器会在图片上从头到尾“滑过”一遍


13小狗过滤器-动图.gif



每滑到一个地方,就将该地方的图像特征提取出来。

那它是怎样提取的呢?

别忘了,在计算机的眼里,世界是这个样子的:

14卷积举例01.png

(为了简化问题,这里将像素值仅用0和1表示)


假设过滤器是这个样子的:

15卷积举例02.png


当橘色的过滤器在绿色矩形框中,缓慢滑过时,

我们用橘色过滤器中的每一个值,与绿色矩形框中的对应值相乘、再相加


有点儿拗口,直接看图:

16ReLU-01.jpg



结果“4”,就是我们从第一个橘色方框中,提取出的特征。


如果我们每次将橘色过滤器,向右、向下移动1格,则提取出的特征为:


17过滤器-动画.gif




你可能会问:

我知道绿色矩阵代表一张图片,是计算机“眼中”图片的样子。

但是,
经过橘色过滤器提取特征后,得到的粉色矩阵,那是什么?

18特征图是什么.png




我们从人类的视角,再重新审视一遍。


这次,我们回到之前的例子中。


仍以这张萌狗为例,它经过“过滤器”提取特征后,得到的是一张……哦,好吧……看起来有点儿模糊的图。

19过滤器-模糊.png




虽然图片模糊了,但是图片中的主要特征,已经被过滤器全部提取出来,单凭这么一张模糊的图,作为人类的我们,足以对它做出判断了。(谁敢说它是一只猫?!)


下面,我们再换几个过滤器试试。

20过滤器-不同效果.jpg




这些就是经过过滤器提取后,得到的不同“特征图片”。



由此我们可以看出,采用不同的“过滤器”,能够提取出不同的图片特征。


你可能又会问:

那过滤器里的数值,该如何确定呢?


。。。。。论坛字数限制,不让我发了,等哪天有时间,再开一帖吧。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 人工智能 图像识别 CNN 卷积神经网络

6步骤3.jpg (54.67 KB)

6步骤3.jpg

4种过滤器-效果.png (116.6 KB)

4种过滤器-效果.png

4种过滤器.png (21.42 KB)

4种过滤器.png

dog-黑白.jpg (41.25 KB)

dog-黑白.jpg

已有 1 人评分经验 收起 理由
guo.bailing + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

沙发
beibeiAI 发表于 2017-10-9 14:39:14
还是看原文吧,帖子的排版效果,真是太糟糕了。

藤椅
飞天玄舞6 在职认证  发表于 2017-10-10 09:25:03
讲的真不错

板凳
eeabcde 发表于 2017-10-10 09:25:50
感谢分享好资源

报纸
glave 在职认证  发表于 2017-10-11 11:13:51
前两天刷屏的新闻,火车站刷脸进站,化妆、戴美瞳,都能识别出来,应该用的就是这项技术吧??

地板
beibeiAI 发表于 2018-1-3 21:12:53
。。。。。。

7
三江鸿 发表于 2022-10-31 23:17:39 来自手机
点个赞加点人气
感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 05:13