在关于数据素养教育框架的这个由两部分组成的系列的第一篇博客中,我介绍了数据素养教育框架的 4 个阶段,组织、大学、高中甚至成人教育项目都可以使用该框架来创建更多全面的数据素养培训。
数据意识,它谈到了每个人都需要知道他们的个人数据是如何被捕获并用来影响或操纵我们的思维方式和我们做出的决定的。
决策素养讨论了人类如何制作各种复杂性的模型以做出更明智和准确的决策。
数据素养教育框架
现在,我想通过讨论数据素养教育框架的第三阶段(AI/ML 素养)和第四阶段(预测和统计素养)来完成数据素养教育框架。
学科领域#3:人工智能/机器学习素养
我的博客“数据和 AI 素养的日益重要——第 2 部分”通过介绍 AI(人工智能)和 ML(机器学习)素养扩大了数据素养对话;也就是说,介绍了 AI 和 ML 模型的工作原理。
AI/ML 素养是了解 AI/ML 模型如何工作,因为它们会不断学习和适应与其环境的相互作用。
当 AI 模型与其环境交互时, AI 模型寻求优化其 AI 效用函数(KPI 和衡量 AI 模型进展和成功的指标)。AI 效用函数向 AI 模型提供正反馈和负反馈(使用随机梯度下降和反向传播),以便 AI 模型可以不断学习和调整其操作,以寻求做出“正确”或“最佳”决策或行动。
人工智能 (AI) 的工作原理
AI 模型通过以下过程进行训练和学习:
人工智能工程师(与业务利益相关者密切合作)定义 人工智能效用函数——衡量人工智能模型进展和成功的关键绩效指标和指标。
AI 模型使用 AI 效用函数在其环境中操作和交互以收集反馈,以便不断学习和调整其操作(使用反向传播和随机梯度下降 来不断调整模型的权重和偏差)。
当 AI 模型与其环境交互时,AI 模型寻求根据 AI 效用函数的框架做出“正确”或“最佳”决策。
AI 模型旨在根据 AI 效用函数中阐明的“价值”定义最大化“奖励”。
人工智能实用功能
AI 实用功能为 AI 系统可以采取的某些操作分配值。AI 模型对可能行动的偏好可以通过将这些结果映射到效用值的函数来捕获;值越高,AI 模型越喜欢该动作。定义 AI 效用函数对于 AI 模型的操作有效性和相关性至关重要,因为 AI 系统基本上是愚蠢的系统,它将不断寻求围绕 AI 效用函数中定义的变量和指标进行优化。
学科领域#4:预测(和统计)素养
预测是关于未来事件可能性的陈述。
预测是自然的、每天都会发生的事情。我们观看新闻以预测明天的天气。我们使用 GPS 应用程序来预测开车到电影院需要多长时间。我们阅读了体育专家的专栏,他们预测您最喜欢的运动队是否会获胜。在每一种情况下,人类或机器“专家”都在将隐藏在历史数据中的模式、趋势和关系与当前的运营、环境、财务和社会数据相结合,以做出预测。
预测素养是了解我们如何利用模式、趋势和关系来尝试预测可能发生的事情,以便我们做出更准确的决策。
我们天生就知道,人或设备过去的表现如何高度预测这些人和设备在未来的表现。看看棒球的内野转移,棒球教练将他们的内野手定位到预计击球手最有可能击中棒球的内野位置。
棒球的内场转移
基于击球手预测的棒球内场变化
虽然美国证券交易委员会警告投资者,基金过去的表现并不一定能预测未来的结果,但我们也知道,随着时间的推移,管理良好的基金会优于管理不善的基金(并希望相应地引导我们的投资,而不是投资于最新的热门金融趋势)。
下一部分可能会让人们有点畏缩,为了更好地实现预测素养,我们将快速入门统计基础知识。对于那个很抱歉。
关键统计概念
统计学是大量收集和分析数值数据的实践或科学,特别是为了从具有代表性的样本中推断出整体的比例。
我们天生就知道,对未来的预测永远不会 100% 准确。对可能发生的事情进行预测是基于概率、置信水平和置信区间。
概率是某事将要发生或某事为真的可能性(从 0% 到 100%)。
例如,巴里·邦兹在 2004 年与旧金山巨人队的赛季中被击中的概率为 36.2%(每 100 次击球命中 36.2 次),而他在同一赛季击球时上垒的概率为 60.9% (每 100 次击球有 60.9 次击球或步行……这绝对是一个惊人的统计数据)。
由于预测发生在一个范围内(因为预测不是 100% 确定的),我们利用数据中的差异来使用置信水平构建这些置信区间。
方差衡量数字或观察值与同一组数字或观察值的平均值或平均值的变异性
置信水平 是您期望在置信区间的上限和下限之间重现估计值的次数百分比
置信区间是如果您再次运行实验或以相同方式对总体重新采样,您期望您的估计值落在某个时间百分比之间的值范围。
平均值 + 方差收益率置信区间
虽然统计可能不是任何人最喜欢的话题(除了我的两个精算朋友),但我们需要了解基本的统计概念,以便我们能够在信息不完整甚至相互冲突的世界中做出明智的决定。
这是一个链接,它很好地概述了其他重要的统计概念:Shirley Chen的“数据科学的 8 个基本统计概念” 。
批判性思维的重要性
批判性思维是对问题或主题进行明智和客观的分析、探索和评估,以形成可行和合理的判断。
在当今数据甚至图像都可以如此轻松地操纵的时代,保持健康的怀疑态度非常重要。这里有一些简单的批判性思维规则可以帮助你做出更明智的决定并避免灾难性的选择(这仍然不能解释我是芝加哥小熊队的球迷)。请参见图 6。
永远不要接受最初的答案作为正确答案。太容易把最初的结果拿来认为它已经足够好了。但足够好通常 还不够好,需要投入时间和精力去探索是否有更好的“足够好”的答案。
持怀疑态度。 永远不要接受某人的“事实陈述”为“事实”。学会质疑你阅读或听到的内容。不管别人告诉你什么,很容易从表面上接受,但这是一个懒惰的标志。并学会从意见中辨别事实。你知道他们对意见的看法……
考虑来源。当你收集需求时,考虑可信度、经验,也许最重要的是,来源的议程。并非所有来源都具有同等价值,来源的可信度在很大程度上取决于情况的背景(请参阅文章“医生无法理财的原因”)。
不要得到快乐的耳朵。不要听你想听到的答案。相反,专注于倾听你没想到会听到的答案。那是学习真正开始的时刻。
拥抱挣扎。简单的答案并不总是正确的答案。事实上,当涉及到不是在数据科学世界中,而是在社会和商业世界中面临的复杂情况时,简单的答案很少是正确的答案。
保持好奇;有永不满足的学习欲望。在技术瞬息万变的世界中尤其如此。好奇心可能害死了猫,但无论如何我都不希望猫为我做决定。
应用合理性检验。从你在别处看到或读到的内容,你所读的内容是否有意义(抱歉,教皇在上次美国大选中没有投票)?尽管技术变化如此之快,但社会规范和道德规范却并非如此。
停下来思考。找一个安静的地方,在那里你可以把自己隔离起来,真正思考你所团结的一切。在急于回答之前花点时间思考和思考。
冲突是好的……也是必要的。生活充满了权衡,需要在众多竞争因素之间取得微妙的平衡(增加一个因素,同时减少另一个因素)。这些类型的冲突是创新的燃料。
批判性思维和成为“数据科学学生”
摘要:生活就是在掷骰子之前提高赔率
数据素养是对组织如何使用我们的个人数据的意识,这些组织正在使用高级分析来发现我们的个人偏好和偏见,从而影响您做出决定的概率。
数据素养教育框架由4 个学科领域组成:
数据意识,它谈到了每个人都需要知道他们的个人数据是如何被捕获并用来影响或操纵我们的思维方式和我们做出的决定的。
决策素养讨论了人类如何制作各种复杂性的模型以做出更明智和准确的决策。
AI/ML 素养是了解 AI/ML 模型如何工作,因为它们会不断学习和适应与其环境的相互作用。
预测素养是了解我们如何利用模式、趋势和关系来尝试预测可能发生的事情,以便我们做出更准确的决策。
最后,生活就是掷骰子,因为无法保证您会得到预期的结果。每次开车,每次过马路,每次坐飞机,你都是在掷骰子。
系好安全带并不能保证你不会死于车祸。戴自行车头盔并不能保证您不会在骑车事故中受伤。
底线:数据素养的实际方面是了解概率是如何工作的,以及我们可以通过研究和分析做些什么来做出明智的决定,从而提高我们在掷骰子时获得预期结果并且可以生存的可能性和。你个人的成功(以及最终人类的成功)高度依赖于这种理解。
编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了
DA内容精选


雷达卡



京公网安备 11010802022788号







