请选择 进入手机版 | 继续访问电脑版
楼主: 时光永痕
994 0

[数据挖掘新闻] 为什么Excel用户应该学习Python [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

22%

威望
0
论坛币
26 个
通用积分
49.7565
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-19

时光永痕 学生认证  发表于 2020-11-4 20:29:53 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
为什么Excel用户应该学习Python
Microsoft Excel已有30多年的历史了,而且在可预见的将来它不会改变。实际上,Excel正面临来自诸如Google Spreadsheets之类的挑战者和诸如Airtable之类资金雄厚的初创企业的巨大竞争,这两家公司都在追随Excel在全球约5亿庞大的用户群。精通技术的中小型企业采用Excel的创新替代方案。但是,在大型企业空间中占便宜是完全不同的。几乎不可能将Excel与Office 365和庞大的基础结构一起替换和替换,这些基础结构正在为不断增长的工作负载提供服务。并非不可能,但是可能要花费数十年。
无论我们喜欢与否,世界都在Excel上运行
最近,我与一家大型咨询公司进行了交谈,该咨询公司为一家年收入超过1000亿美元的企业提供服务:“它们完全在Excel上运行。” 作为该咨询公司的最高执行官之一,他坦白地承认。这也不例外。让我们以一家拥有数万亿美元资产的银行为例:他们如何管理信用风险?他们的成千上万的风险管理者有可能持有分散在整个组织中的成千上万的电子表格中最有价值的资产之一。
确实也不例外。保险公司?药品?零售?我想在这里做出一个有根据的猜测,全球数十亿美元的年收入很可能实际上是通过数十亿张电子表格运行的。
事情怎么能做到这么远?也许Excel被误用作临时的快速修复程序,但从未成熟为永久的企业级解决方案。
企业级Mezzogiorno风格:永远使用临时解决方案
塞利南德(E庙)的赫拉神庙| 来源:维基百科(图片 由其创建者发布到 公共领域)
意大利南部,通常被称为Mezzogiorno,是欧洲最美丽,最贫穷,治理最差的地区之一。我的一个好朋友,住在西西里岛,享受着令人艳羡的晴天,美丽的风景和令人垂涎的美食。为了使葡萄酒爱好者感到欣慰,一些世界上最好的酿酒厂都位于该地区。另一方面,日常生活可能很艰难。“整个地区取决于临时的,快速修复的基础设施类型,永远不会被永久性的解决方案所取代。如果事情不会破裂,这是一个奇迹。” 我亲爱的朋友对一瓶西西里岛的红酒说:但是,如果他们这样做呢?
乍一看似乎听起来有些夸张。但是,IT部门的运作方式是否与西西里岛的官员有所不同,濒临崩溃?可能出什么问题了?很多。甲骨文一直以来都是微软的生死攸关的竞争对手,它汇总了由于Excel滥用而导致的最大业务失败的清单。例如,所谓的“伦敦鲸”事件造成了摩根大通高达65亿美元的损失和罚款。由于Excel中过多的公式转换,该银行的风险分析师错误地估计了其综合信贷投资组合的不利影响。
Excel于1987年推出。当时人们使用传真机
我在1992年购买了第一台笔记本电脑。它具有当时的强大功能:它使我可以通过电话线将Word文档发送到收件人的传真机。这是一个伟大的发明,使我作为一名前撰稿人可以将我的作品提交给我的老板,后者将手动检查打印输出并通过传真将其发送回去。Excel那时才五岁,我想大多数人还没有听说过互联网。
我大约在五年前开始使用Excel,后来我迅速成为了高级用户。为了拯救Excel,我不得不承认我仍然每天都在快乐地使用它。它具有许多功能,即使是经验丰富的Excel用户也无法意识到其中的许多功能。但是,我们应该仔细看一下Excel:这仍然是企业数据的通用解决方案吗?当然不是。
Excel在企业中的角色需要重新定义
首先,Excel是存放关键任务数据的正确位置吗?大型企业往往具有高度正规化,非常严格的IT安全策略。但是,另一方面,将电子表格作为数十亿美元业务的主要引擎的滥用完全是无法控制的。这就像在封闭的社区中拥有一所房子,并受到各种警报系统的保护,然后在周末将钥匙交给您的十几岁的孩子–留下了一个装备精良的酒吧,您的珠宝和生活中的现金被塞进了商店。在厨房的桌子上的纸板箱。
但是,企业用户还有哪些其他选择?
很难想象没有电子表格的企业世界。非常像很难想象如果没有父母的葡萄酒和威士忌来吸引所有出现在门口的人,那么一场青少年的家庭聚会。
但是,如果您的银行通过电子表格管理其数万亿美元的皇冠上的珠宝,它会悄悄地这样做。像贝蒂·福特中心(Betty Ford Center)一样,帮助大型企业克服电子表格成瘾的咨询工作也在秘密地进行,试图保护其富有和著名的客户免受声誉损害。赌注很高。
Python适用于数据科学家。是吗?
我遇到的大多数公司仍然将其知识工作人员分为两类:具有编码技能的公司和没有编码技能的公司。由于有了Evans Data Corporation EDC,全球大约有2300万软件开发人员。有多少数据科学家?例如,只能根据目前300万人口的Jupyter项目用户总数进行估算。即使我们将人数大幅度地增加到具有编程技能的3
缺乏编程技能不过是文盲
在图书产量开始增长的那段时间里,大约有12%的成年人口能够读写。今天,全世界约有86%的成年人有识字能力。同时,只有不到1%的成年人能够读写代码。
“尽管最早的书面交流形式可以追溯到公元前3500-3000年,但扫盲在过去的几个世纪中仍然是与行使权力密切相关的非常受限制的技术。” Ourworldindata.org
识字与权力的行使有关
在《福布斯》和《财富》杂志提供的排名中,可以很好地观察到少数个人和公司手中的财富积累。科技的财富正在不断增长。但是,技术素养与财富和权力的积累之间是否存在联系?没有足够的证据来回答这个问题,因为这个问题尚未得到很好的研究。
尽管缺乏研究:我们可以对商业世界中的编码技能做出什么假设?
想要授权业务用户?教他们编码
如果亚马逊Alexa是16世纪发明的,当时只有不到12%的人口能够读写,那会发生什么呢?人们学习以书面形式进行交流的动力可能很小。当您大喊时,为什么要花时间和精力来掌握在纸上书写微小符号的技能:“ Alexa!明天洛杉矶的天气如何?” 当然很方便。但是,便利的代价很高。另外,随着用户习惯于在智能设备中大喊大叫并将命令输入到智能设备中的舒适性,他们越来越害怕读写的基本技能:“掌握它必须非常困难……”
用Python编码难吗?不比用自然语言书写难
Python是一种高级语言。它应该是人类可读的,并且毫不奇怪,大多数Python教程都是从编写print(“ hello world”)开始的。猜猜print(“ hello world”)是做什么的?它打印两个世界的hello世界。在计算机屏幕上显示这两个单词的过程被抽象化了。这就是为什么Python也被称为声明性语言的原因。您,您的代码作者,声明您希望程序执行的操作:打印问候世界,执行计算或可视化数据。其余的都在照顾。命令式编程语言可让您描述控制流程,其含义是:您必须编写程序执行打印问候世界,执行计算或可视化数据的精确程度。相比之下,这就像驾驶自动换档(声明式)vs。
高级的声明性语言使编程变得异常容易。但是,全世界只有不到1%的成年人能够编写和阅读代码。毫不奇怪,企业开始发现Python作为其关键任务工作负载的替代Excel。摩根大通(JPMorgan)最近因其努力教他们的分析师编写代码而成为新闻头条,整个组织中很可能有成千上万的员工。是的,同一家摩根大通在“伦敦鲸”灾难中损失了65亿美元。也许他们吸取了教训,不是可以在Excel中完成的所有操作都还应该在Excel中完成?
如果您曾经编写过Excel函数,则可以在Python中执行相同的操作,甚至更多
使用Python就像拿起Excel一样容易。 每个Excel用户都知道对一列中的数字求和是多么容易。只需编写= SUM,然后选择要汇总的单元格即可。如果要汇总满足特定条件的单元格,可以编写= IF或= IFS语句。所有这些都可以在Python中完成。作为高级Excel用户,您可能会问自己:“如果我已经知道如何在Excel中进行相同的操作,为什么我应该学习Python?” 这是一个很好的问题,几年前我一直在问自己。这是我的答案:
#1精通Excel比环绕Python更难
Excel不仅是一种产品,而且是三种产品合二为一:
众所周知的Excel及其工作表和函数语言
强大的查询功能,用于混搭和清理数据
Power Pivot作为数据透视表的计算引擎
如果要使用电子表格,请清理数据并在连接到一个数据模型的多个表上执行高级计算-确保可以在Excel中执行此操作(令人惊讶的是,大多数高级Excel用户并不知道这一点)。但是,您必须四处使用三种不同的UI和三种独立的语言:Excel的常规函数??语言,Power Query中的M语言和Power Pivot中的DAX(数据分析表达式)。哦,我有提到VBA吗?
我发现用一种一致的语法和语义用一种语言完成以上所有操作更为方便。顺便说一句,为什么我比R更喜欢Python?因为Python更容易学习。易用性对我来说很重要。
#2周围的人可以理解您用Python编写的内容
当业务用户将自己的Excel电子表格扔到栅栏上时,数据科学家通常一无所知。即使是业务用户,也很难阅读和解释其他人的电子表格。现在想象一位从未使用过Excel电子表格的数据科学家。
许多数据分析师和数据科学家都使用Jupyter笔记本。之所以称其为“ Word for Geeks”,是因为Jupyter Notebooks允许您像Word文档一样使用标题和正文来以自然语言讲述您的故事,此外您还可以在同一位置编写和执行代码。
一旦发现了Jupyter Notebooks,我立即就爱上了它,因为它使我可以基于在Python中准备,分析和可视化的数据以自然语言交流我的想法,所有这些都在一个文档中。如果我碰壁,我可以与数据科学家共享我的Jupyter笔记本,他可以阅读我的文档,了解我的数据分析并了解我离开的地方。他完成工作后,我可以通读它,看看他做了什么。
商业用户和数据科学家终于相爱了!
#3 Python是开源的,社区非常活跃且富有创造力
我想不出一个与数据相关的问题,我将无法通过Python及其一个库来解决。无论是从Excel提取数据,清理数据,执行计算,可视化数据还是利用各种AP??I,都肯定有一个包装。
在不久的将来,我设想银行内部的分析师,例如,使用内部专门为其专有风险评估而构建的Python程序包。除了其创建者以外,没有其他晦涩的Excel功能。仅有一个存储库和一组集中维护的Python软件包,用于银行的内部风险分析和评估。
“但是你不是说开源吗?” 一些有关的声音可能会问。开源不应被误解为“门户开放”。您可以应用所需的任何安全级别,从而确保具有专有风险模型的程序包仅对组织内选定的一组人员可用,而其他任何人都不可用。
#4 Utility Grade是Python而不是Excel的亮点
越来越多的数据分析和数据科学PaaS解决方案是根据PB级,高度协作的用例构建的,例如Cloudera Altus,Microsoft Kusto和T-Systems数据科学工作站。
如果您的业务需要您近乎实时地处理大量数据,并且您越来越多地面临半结构化和非结构化数据,那么最好在上述PaaS之一中使用Python,Jupyter Notebook和大数据集群来更好地服务解决方案。
#5您想继续工作
由于麦肯锡最近的研究,到2030年,约有3亿工人需要接受再培训,以满足劳动力市场的需求。在我以前的文章中,我写了两篇博客文章,内容涉及从职业生涯过渡到数据分析和数据科学。
编程全部与自动化有关。公司使流程自动化的越多,他们对执行平凡任务的人员的依赖就越少。“你想保留你的工作吗?” 一切都归结为这个问题。如果回答是“是”,则应考虑学习编码。Python是一个很好的起点。
1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python EXCEL xcel exce cel

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 10:21