无论我们的性格如何,惯性常常使我们面对数据科学家. 当一开始就面临一个大而棘手的问题时,当我们没有立即看到通往答案的道路——甚至没有看到通往通往答案的小路的道路时,我们会(有理由地)感到瘫痪. 我们整个潜在的建模方法和统计技术库开始在我们的脑海中盘旋,轮流将彼此排除在我们的考虑范围之外。还有数据……哦,数据。我们会在这个特定的数据集中找到什么样的令人抓狂的问题,让我们想把头发扯下来?我们准备数据需要多长时间才能开始分析任何东西?客户希望昨天完成!只是……开始可能很难。
这是哪里敏捷思维是你的朋友。与其尝试详尽地计划整个路径,不如问问自己,“下周我能做些什么来朝着我的最终目标取得一些进展?” 这是敏捷社区中的一句著名格言,即您对项目的了解永远不会比项目开始时的了解少。这是在项目规划中要记住的最重要的一点之一,也是我们经常忘记承认的一点。那么,你能做些什么来启动这个学习过程呢?
它通常从简单但可实现的事情开始,例如绘制数据,然后对其进行总结以了解其分布的形状及其五位数摘要*并识别其缺陷。请记住,您的客户可能也不知道内部和外部的数据集,也不知道如何在战术上利用它来解决提出的问题。毕竟,客户雇用你是为了帮助解决这个问题。任何关于数据的新知识,无论看起来多么小,都代表着重大改进。
而且你学到了一些东西。也许这会让你大开眼界,看看接下来两周会是什么样子。例如,“到下周,我们可以完成 X,然后下周,我们可以完成 Y。” 所以下周,你设定了一个完成 X 的目标。也许你能一直做到,也许你没有。但是你在这个过程中学到了一些东西。新发现的知识可能会让你陷入沉思:“好吧,我原计划下周完成 Y,但我现在了解到的情况表明,最好先完成 Z,然后再完成 W。” 所以,去做吧。
这种在实现最终解决方案方面取得可证明进展的快速、持续、迭代的方法——即使最终解决方案从一开始并不明显——是敏捷数据科学的核心原则之一。这些迭代通常被称为“冲刺”,这是一个源自田径运动的绰号,我一直很欣赏,因为在每个冲刺的狭隘范围内,都有一条终点线!迭代方法意味着您和您的团队可以享受在整个项目中多次越过终点线的感觉,一遍又一遍地享受这些小小的成功。这还提供了一个附带好处,即知道您在每个 sprint 结束时为您和您的客户都完成了一些重要的事情。这可以作为一个里程碑,向您的客户保证您在实现最终目标方面取得了令人鼓舞的进展。
所以,是的,开始吧。做一点事。就像,只有一件事。每一次冲刺,每一次。然后,利用这些新知识找出下一步要做的最好的事情。冲洗并重复,最终你会完成,你可以沉浸在出色的工作和快乐的客户的满足感中。去做吧。有用。
*对于普通的非书呆子,“五位数摘要”通过最小值、第 25 个百分位数、中位数、第 75 个百分位数和最大值来描述数据集的一般形状。它可以帮助您了解数据的“传播”——这些值是否围绕某个数字紧密地打包在一起,或者数据集中是否存在广泛的值。
相关帖子DA内容精选
|


雷达卡



京公网安备 11010802022788号







