人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › 数据分析与数据挖掘 › 5种有意义的方法来改善组织中数据科学的采用

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: 时光永痕

576 0

[数据挖掘新闻] 5种有意义的方法来改善组织中数据科学的采用 [推广有奖]

0关注
14粉丝

svip3

学术权威

12%

（VIP/贵宾）三级

87%

威望: 0 级
论坛币: 26 个
通用积分: 49.7576
学术水平: 4 点
热心指数: 4 点
信用等级: 4 点
经验: 34070 点
帖子: 2731
精华: 0
在线时间: 317 小时
注册时间: 2020-7-21
最后登录: 2024-5-10

楼主

时光永痕

发表于 2020-8-25 16:54:18 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

5种有意义的方法来改善组织中数据科学的采用
概述：
这篇文章是关于提高数据科学团队的效率以及改善数据科学家和利益相关者之间的协作以取得更好的结果。
调整目标：
无论具体项目如何，在开始工作之前就预期的结果和目标达成一致都是一种最佳做法。但是随着机器学习（ML）模型的出现，双方讨论了给定项目成功的关键措施。使用诸如“目标关键结果（OKR）”之类的框架是一种实现目标与期望保持一致的好方法。
了解问题/业务背景：
有些公司有机地这样做，而另一些则没有。如果数据科学团队是公司的新手，则他们应该对问题空间有基本的了解。利益相关者必须说明他们想要实现的目标以及为什么现在至关重要。有关产出消耗方式的具体情况是此讨论的主要部分。以下是两种常见的输出消耗方案：
由外部各方消耗（例如，做出信用决策的投资者，客户将您的欺诈预测转变为针对最终用户的产品提炼，最终用户与结果互动的网站/电子商务上的建议）。
由内部客户消耗（例如，您的销售团队可以使用潜在客户评分模型来确定下一个要致电给谁，确定给每个销售助理多少奖金，改善客户支持的电话路由，或推动正确的内容正确渠道上的合适用户，以提高用户参与度）。
在上述所有情况下，至关重要的是要了解什么是可能的，输出是什么样的，以及接收方利益相关者/团队将如何使用输出。利益相关者需要花时间并根据需要对数据团队进行有关问题上下文的教育。此步骤将避免进一步的灾难-知道上下文可以帮助数据团队在问题背后提出正确的问题并快速获得答案，而不必费力。
分享样本结果和用法：
一旦确定了目标/度量标准并达成共识，最好在涉足项目之前让利益相关者适应样本结果。现在还不是时候讨论模型的实质内容，因为还为时过早–在这一点上，您将只了解问题上下文，但尚未弄清楚哪种ML模型最适合您的情况。此外，花太多时间来整理细节可能意味着浪费时间和机会。
如果输出是概率，即介于0到1之间的值，请考虑提供此类值的范围，并观察其如何转换为业务决策。当您共享输出将在0到1之间的范围时，这会使您的利益相关者感到不舒服，还是他们理解？如果他们跳出座位，他们会问您更多问题还是只是不同意？如果是后者，请返回上一步；如果是前者，则可以通过提供与行业相当的选件来帮助他们了解如何使用输出。如果这对您来说太多了，那么这是一个向经验丰富的专业人士寻求帮助的好时机。
模型理解：
有几种方法可以在不直接解释其复杂过程的情况下对模型的利益相关者进行培训。您无需精打细算，但是可以公平地说，即使您可能不确定模型将选择哪种特定路径来得出其结果。如果您使用的是模型集成，则情况会更加复杂。
那么，这里有什么帮助呢？当然，有几种模型和几种形式的输出，例如线性回归，逻辑回归，二进制分类器，RNN和CNN等。更重要的是，有一些方法可以用通过建立信任的过程建立信任并改善相互协作的方式。这里有些例子：
在公司外部（或内部）共享一个众所周知的用例：您的用例与模型（与另一个模型（例如，亚马逊产品推荐系统））有何不同？这可能会使利益相关者采取不同的观点，因为他们没有根据更熟悉的业务环境来判断您。
解释输入和数据源：深入了解构建输出的过程。这对其他两个原因也是有好处的-（a）要求进一步投资以完善输入，例如收集更多数据，新数据，更高质量的数据源等。（b）对已经开展的工作设定期望超越模型构建；有时会忘记最重要的部分是数据收集，而不是模型本身（取决于上下文）。
消除误解的机会：概率值与排名分数不同。帮助利益相关者理解这不仅是输出，还包括输出中错误和差异的机会。
在历史数据集上运行模拟：为了建立信心，在将模型投入生产之前，您可以通过共享历史数据上旧过程的输入/输出与新过程（即ML模型）的输入/新输出来共享信任。假设结果是可比较的，则可以带来信心。
定期举办路演：最好通过内部路演和演示分享您和您的团队正在做的改进。这样可以在您的流程中建立可见性和透明度，并进一步增加与其他部门协作的机会。
持续的合作与改进：
与任何模型构建工作一样，它不仅是一次性的工作，而且是迭代的。如果该模型的表现不如一开始所期望的那样，那么让利益相关者保持了解可以帮助您获得急需的反馈循环。为了使模型能够发挥作用或验证您是否选择了正确的模型，您需要从生产系统中汲取教训。这可能还需要最终用户，内部客户和利益相关者的帮助。公司中可能存在关键的预算约束，因此，知道模型可以提供多少改进是数据科学团队和利益相关者共同做出的决定。
希望以上内容是数据科学团队与其他利益相关者保持一致并开始影响关键业务指标的一些有用的原则和步骤。祝合作愉快！

关注 CDA人工智能学院，回复“录播”获取更多人工智能精选直播视频！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：数据科学有意义的数据科学家人工智能模型构建

[数据挖掘新闻] 5种有意义的方法来改善组织中数据科学的采用 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[数据挖掘新闻] 5种有意义的方法来改善组织中数据科学的采用 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群