楼主: 时光永痕
394 0

[数据挖掘新闻] 深度学习在图像识别中的使用和滥用 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

54%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-28

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
从解锁手机到在 Facebook 上自动标记图片,深度学习增强了多个领域的图像识别。这通常被称为计算机视觉,这意味着算法可以像人类一样看到和理解图像。

然而,由于计算机使用二进制代码运行,机器学习将图像转换为轮廓、渐变和颜色代码,然后将其输入算法以使它们搜索模式。计算机识别图像的唯一方法是将其与在训练期间已经看到的庞大数据数据库进行比较。然后,机器通过比较轮廓、阴影、光线等来计算当前图像属于特定类别的概率。

神经网络:它们是如何工作的

计算机的二进制判断意味着算法看不到,例如狗或饼干的图像。它会看到它试图理解的数据行和行。这就是神经网络发挥作用的地方。这些是分层排列的计算单元集。每个单元单独处理信息,该层创建一个输出并将其传递给下一层,并且该过程一遍又一遍地重复。

事实上,每一层都是一组过滤器,从基本的几何过滤器(边缘、角度、圆)到能够检测身体部位、动物甚至动物品种的更复杂的过滤器。结果是图片中的对象属于预定义类别的概率。

神经网络使用得越多,它就会变得越好,因为它开始从构成实际训练的过去经验中学习。事实上,神经网络是旨在比较像素矩阵的相似性的统计模型。

为了进行有效的训练,对标记的训练图像有巨大的需求。主要数据库是 Image Net,一个包含 320 万张图片的数据库,其次是 AlexNet。

深度学习在图像识别中的应用

有几个领域可以直接受益于人工智能图像识别. 以下是关于这项技术如何解决商业、医疗保健和物流中的日常挑战的一些想法。

图像分类

大多数时候,对计算机视觉的需求不仅仅是在社交媒体上标记朋友。它可以帮助确定肿瘤是否癌变,或增强发票处理所需的光学字符识别工具。

图像分类的增强版本是具有本地化功能的版本。这与更简单的版本执行相同的任务,但是一旦它识别出一个对象,它还会在它周围绘制一个边框并附加一个标签。当图片中有多个对象并且每个对象都需要分配其类时,这是有益的。该技术的直接应用是帮助车辆与其他交通参与者保持距离。

对象分割

一旦识别出一个物体,就有必要将它分成更小的部分,这有助于进一步识别。例如,如果图像被标记为“动物”,耳朵、尾巴和爪子的识别可以指出它是哪种动物。

图像着色和重建

重新着色服务于更多的艺术和历史目的,但可以帮助打击犯罪,特别是在警察证据照片的情况下,这些照片通常是黑白的。

可以训练图像识别算法来根据现有对象和识别的颜色填充图片的缺失部分。通过将图片与原始图片进行比较,对图片的修改版本进行训练。这里的应用可能包括机场安检,闭路电视摄像机创建碎片图像,然后可以用来重新创建人脸。

深度学习可以做得更多,并提高给定图像的分辨率。这种算法通过比较原始图像的缩小版本然后反转该过程来学习。

Deepfake 或图像合成

图像深度学习最可怕的应用可能是 deepfake。一种人工智能驱动的方式,将多个图像源合并为一个看似可信但实际上并不存在的单一产品。

核心的人工智能限制

与人脑相比,神经网络的主要限制是无法在对象类别之间传递知识。神经网络通过扫描属于该类别的数千张标记图像来学习每种对象类型的特征。如果没有足够的培训材料,或者内容变化不够显着,算法会根据上下文犯有趣或危险的错误。

当涉及到图像处理时,深度学习的另一个问题是它不了解上下文。它可以识别图像中的单个对象,但无法理解它们放在一起时的含义。例如,在一张家庭照片中,AI 可以识别三个人和一个动物,也许它可以更深入地检测出有一个成年男人、一个成年女人、一个孩子和一条狗,但除非它经过训练标记为家庭的图像,它不会像人类那样自然地分配这个类。

在计算机视觉完全理解它所看到的东西之前还有很长的路要走,但在那之前我们可以为它是更好地检测癌症比人类医生。

最后的想法

总体而言,自 2000 年以来,投入人工智能的资金以 5 倍甚至 10 倍的倍数飙升,其中很大一部分投资用于计算机视觉领域。

      相关帖子DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 FACEBOOK 计算机视觉 EBook image

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 16:19