在继续使用高级工具来改进开发有用的应用程序的主题中,今天我们将在不断变化的环境中访问功能工程。人工智能(AI)越来越多地用于分析数据,而深度学习(DL)是AI更为复杂的方面之一。在多个论坛中,我讨论了超越高度依赖不仅需要纯粹的编码,甚至超越了基本框架的需求。DL程序员讨论过。复杂性的关键之一是找出对任何系统都重要的正确数据属性或特征。在DL中,这甚至更为重要,这既因为数据集更大,又由于推理引擎对过程代码的透明性较差。就像这是第一次一样棘手,随着环境的变化,它必须是一个可重复的过程,而系统也必须随之变化。
定义初始功能集很重要,但这并不是游戏的结局。尽管许多人关注DL基于更多数据更改结果的能力,但这仍然意味着使用相同的功能。例如,这些功能是众所周知的放射学。正在获得更多重要培训示例,以了解这些功能的外观变化。但是,有什么新肿瘤?可能需要将新功能添加到组合中。在受监督的系统中,这很容易修改,因为您可以提供带有功能的带标签图像,并且可以对系统进行重新培训。
但是,消费者的口味呢?定义特征后,深度学习系统会查找不同定义特征之间的关系并提供分析。但是,时尚会随着时间而改变。例如,想象一下一个系统,该系统定义了所有裤子都带有褶皱的时间。裤子是否应带有褶皱的问题不是问题,因此设计师没有训练系统分析褶皱的存在。虽然可以在完整的数据集中定义功能,但是出于性能问题,该功能并未设计到引擎中。
突然之间有了变化。人们开始没有褶皱地买裤子。这成为消费者想要的东西。尽管这可能在完整数据集中,但推理引擎不会评估该变量,因为它不是已定义的功能。环境已经改变。如何识别它,改变DL系统?
SparkBeyond是一家致力于解决该问题的公司。虽然该产品可用于初始功能工程,但主要优势在于,它可帮助DevOps和其他流程来使DL驱动的应用程序在不断变化的环境中保持最新状态。
公司平台要做的是分析DL系统正在使用的基础数据。它不是AI本身,而是利用随机森林(RF)。该技术是一种使用不同参数运行多个测试的方法。这得益于云技术的进步以及横向扩展到多个服务器的能力。可以分析大量决策树,并可以看到新的模式。RF是机器学习超越纯粹的AI定义的一种方式,因为它可以比其他方法更快地创建洞察力,从而在大型数据集中识别新的分类和关系。
消费者行为以及金融和其他市场行为的复杂性要比褶皱和无褶皱的复杂得多,重要的是要尽快识别并适应变化。“不断变化的环境对于分析至关重要,” SparkBeyond的影响管理总监Mike Sterling说。“生成大量的假设和模型,并对其进行测试,对于识别这些变化,以使深度学习系统适应这些环境中的准确性至关重要。”
人工智能本身并不存在。它是一项适合大型解决方案以解决业务问题的技术。在保持相关性的同时,没有市场停滞。随着越来越多的地方使用深度学习系统,如何以及何时更新它们至关重要。分析数据集的能力对于初始特征工程以及保持系统相关性和准确性的持续过程都是至关重要的。
如果可以的话,我认为这是最终将成为类似于90年代4GL开发的开发套件的一项功能。这将需要几年的时间,但这是将更多工具整合到深度学习环境中的步骤

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


雷达卡



京公网安备 11010802022788号







