搜索

tag 标签: 数据分析师AIU人工智能学院——数据科学与人工智能从业者的在线大学

相关帖子

版块 作者 回复/查看 最后发表
SAS/WA与数据仓库——数据分析师培训项目系列文集 attach_img digest 计量经济学与统计软件 大数据之魂 2012-8-22 1400 70758 whutiger 2019-1-28 23:23:46
走在数据分析师的成长道路上! 学术资源/课程/会议/讲座 Still.. 2013-8-19 137 12798 sunshine502 2017-4-5 15:32:06
干货!就业信息推荐,数据分析师何去何从! attach_img 数据分析师(CDA)专版 Still.. 2013-9-10 271 25606 Quant0160601 2016-9-1 15:39:51
【数据分析师】自学还是白学? attachment digest 数据分析师(CDA)专版 Still.. 2013-9-25 373 23404 Shanshan768 2016-1-24 15:32:10
数据分析师成长之路之心术篇-Join Learn attach_img 计量经济学与统计软件 Still.. 2013-9-4 327 19059 冬季的太阳 2015-10-27 22:47:15
CDA(2月第四期)数据分析师系统认证培训,入行技能升职,课程体系优化! attach_img digest 计量经济学与统计软件 Still.. 2013-11-12 724 45968 Still.. 2015-2-6 11:54:32
电商数据分析在线交流提问贴-一起聊聊! 数据分析师(CDA)专版 Lay.Terry 2013-10-20 139 10439 hsj0624 2014-7-11 15:52:54
如果你也想当数据分析师 计量经济学与统计软件 胖胖小龟宝 2014-5-6 4 2836 liaodandan 2014-5-19 22:58:22
直击现场!【数据分析师系统培训】—Join Learn digest 计量经济学与统计软件 Still.. 2013-10-4 228 13029 hbsxj2011 2014-5-11 11:24:03
【第二期】!11月2日早8:30继续充电,升级的内部资料,免费鸡腿套餐等着你来拿! digest 计量经济学与统计软件 Still.. 2013-10-31 52 5457 hbsxj2011 2014-5-9 22:39:29
数据分析是...技术还是艺术?—Join Learn attach_img digest 计量经济学与统计软件 Still.. 2013-9-2 330 20853 shufelyc 2014-3-7 15:35:44
<招聘信息>奇虎360正在招聘数据分析师 数据分析师(CDA)专版 easy_zj 2014-2-28 3 2731 easy_zj 2014-3-2 09:35:41
数据分析行业公益沙龙:数据分析师职业价值与职业发展规划 attach_img 数据分析与数据挖掘 shelly518 2014-2-24 0 1619 shelly518 2014-2-24 18:48:18
【数据分析师】系统培训打架报名中!—Join Learn attach_img 数据分析师(CDA)专版 Still.. 2013-8-27 612 72161 匿名网友 2014-1-11 10:06:48
贵?现场班半价,仅此一天!11.11.半折可别忘了精神食粮! 计量经济学与统计软件 Still.. 2013-11-9 347 8847 mssr 2013-11-25 01:41:58
招聘数据分析师和数据分析经理职位 经管类求职与招聘 yxhc 2011-2-22 9 5179 A19181111 2013-7-13 10:00:20
猎头代招 外资社交类游戏公司 Data analyst 经管类求职与招聘 ml2538167 2012-1-12 4 2688 haoxiangnan 2012-5-5 10:15:24

相关日志

分享 听说你立志要做数据分析,不如先听听老司机的建议?
huangjinran 2018-6-20 11:59
本文来自微信公众号 “土拨鼠的菜园地” (ID:gh_30a852e13a3a),系公众号原创文章,如需转载,请注明出处。部分图片来源于Pixabay。 每年总有很多人,怀揣着对世界的一知半解、满腔似火的热情、还有对美好生活的向往,走出象牙塔,投身社会。 世界很大,诱惑很多。对于未来,甚至在工作多年后,他们仍然没有清晰的方向,或者缺乏独立、深度的思考。 方向很重要,而人生很短暂。往哪里走,怎么走,再怎么也得花点时间思考一下,不是吗? 如果你决心要在数据科学领域有所作为,或者立志做数据分析,这篇文章提了点小建议,希望对你有所帮助。 一、去大厂还是去小厂? 我们做每件事之前,都要先明确做这件事的目的和意义是什么。 先来问问自己,做数据分析的目的和价值是什么?我的理解是, 致力于用数据帮助企业解决业务问题,辅助业务决策 。 关于这个问题,你可以花3-5年时间来思考和领悟,不急,但需要想清楚。 你还面临一个抉择,到底是去大厂还是去小厂? 之前接到很多猎头电话,不少都会问:“你是做分析还是做挖掘的呀?”刚开始,也常会和猎头在电话里“理论”一番。后来在大厂待过才明白,大厂分工比较细,分析是偏向经营分析,即取数分析写报告,而挖掘则是建模调参部署等。小厂就不一样了,谈需求、确定思路、指标设计、平台搭建、接入数据、处理数据、建立宽表、模型训练、结果分析、撰写报告、模型部署、报表计算、数据可视化等一整个流程,一个人几乎都可能会参与。 如果有机会,请 一定要去大厂历练几年 !大厂大多都很开放,常常敢为天下先,敢于引入一些新的东西,包括技术、思维、制度,技术比较先进,优秀的人也很多。大厂的管理制度也很完善,福利待遇当然会更好些。大厂的数据规模绝对够大,而且应用场景也多,可施展的空间应该会比较大。所以,抱着学习的态度在大厂里混几年,是可以成长很快的。(有好,当然也有不好)大厂流程繁杂,整体效率偏低,提一个取数申请可能需要1-2周。大厂的内部竞争也大,存在于不同项目团队,也存在于同一部门不同成员之间。大项目资源投入大,小项目资源申请很困难,重视程度也不一样。最主要的,大厂分工很明细,不同职位的轮换似乎不大容易,从入职到几年后离开一直做经营分析都是有可能的,容易导致能力的单一,不利于个人综合素质的培养。 相比之下,小厂就灵活多了,人和事都不会很复杂,而且效率也高。小厂可能会优先考虑做这件事情的投入和产出,即看应用效果。(大厂反而愿意给资源去试,短期内不怎么关注投入产出。)所以,在小厂工作,既要学会帮公司赚钱,也要学会帮公司省钱。小厂分工不会很细,大多需要一个人做多种工作。所以,小厂里面的程序员常常身怀多技。但小厂数据规模小,技术实力较弱,团队成员整体素质不高,而且项目流程不大规范,常常怎么简单怎么来,怎么高效怎么来。有些小公司的码农,除了对外发过一两封邮件,平时的沟通几乎是在QQ里,结果待了几年之后连写一封邮件都不会。有些小厂自己没有数据,重要是作为乙方给大企业做项目,这种模式常常受甲方牵制,可发挥的空间很小,而且一个项目周期往往比想象中要长(我本人之前就厌倦做乙方),因此不大建议去这样的公司。 不管大厂还是小厂, 在选择时,建议都要看看所要加入的团队 。 综合来说,建议 先去大厂混几年,再去小厂 找个Title高点的职位发挥自己所长。 再来说几句,什么场景下分析,什么场景下挖掘呢? 分析其实是一个很笼统的概念。把当前营业额跟去年同期做对比发现增长了不少,这个也可以认为是分析。 分析是从数据中发现问题或规律,并提出合理的建议 。分析常常伴随着要写报告,进而要给业务方汇报分析结果。 最好是给决策层汇报 ,因为决策层有拍板的权力,而且对数据结果的感知和可能的应用有自己独到的认知。 如果需要把分析的结果固化下来,定期输出结果,提供给业务方,这个时候就需要开发数据产品了。 挖掘是用算法解决某个具体的复杂问题,用常规分析方法解决不了的 ,如客户流失预警、商品最优推荐组合、最有投递路线规划等。 所以,我一般认为,分析是从数据中发现问题或规律,而挖掘是其中的一块。 数据技能知识一览 二、1-3年,“所见即所得”,打磨基础技术 在职业生涯的初期,请牢记,“ 所见即所得,所感即所知,多见即多得,多感即多知 ”。 不管在大厂还是在小厂,一定要参与到实际项目当中,好好打磨自己的技术。不管是大项目还是小项目,一定要借助来之不易的机会,以极致的工匠精神修炼自身。 你最好能 从基础数据处理做起 。只有这样,你才能早点知道,数据并不像在学校里做实验用到的数据那样“好”,它可能看起来“又脏又乱”。只有这样,你才能早点知道,给你取数的那个程序员是如何花了2-3天甚至一周时间才把数算好。 如果你 精通SQL ,那就太好了,这样就可以直接能够在数据平台查看原始的数据了。 最好要看一看最原始的数据长什么样。你不一定能一下子理解这些数据,但你可以慢慢地感受它们,因为它们所投射出来的是最真实的业务场景。 举个例子吧,原始的会员注册信息数据里面,性别一般填“男”、“男性”、“女”、“女性”、“未知”、“其它”等值,但处理好之后的二手数据里面,性别就变成了“男”、“女”、“未知”等三个值了。仅看这三个值,可能会漏掉一些业务场景,填“男”可能是从移动端输入时选择的,填“男性”则可能是手工填写注册表格时勾选上的。而漏掉的这个场景,说不定就是所要找的那个分析点。 你最好还能 熟练掌握一两门编程语言 ,比如当下流行的Python,作为入行的基础技能。(顺便说一下,码农界普遍认为只会SQL的不算真正的程序员~~) 当今时代,编程已经从娃娃开始抓起。早在5年前,英国规定5岁以上儿童必须学习编程课,法国将编程列入初等教育选修课程,美国已有40个州制定政策支持计算机科学,有35个州将计算机科学课程纳入高中毕业学分体系。 美国前总统奥巴马就曾在全美发起“编程一小时”的运动,旨在让全美小学生开始学习编程。 2017年,浙江、北京、山东等省 确定要把Python编程基础纳入信息技术课程和高考的内容体系。 编程将是一项很基础的技能,也将是承接其他知识的基石。 在未来,会编程很可能跟使用智能手机一样普遍 。 当处理基础数据的时候,必然会在数据库或数据平台上进行。你可能 需要对这些存储数据的环境加以了解 ,如传统的结构化数据库Oracle、Mysql、DB2等,又如当下流行的Nosql数据库HBase、Redis、MongoDB、Cassandra等,再如大数据集群平台、原理及其相关概念,类似Hadoop、Hive、Hue、MapReduce、Spark、Scala、Sqoop、Pig、Zookeeper、Flume、Oozie等。你或者也需要了解数据传输的工具,如DataStage、Kafka、Sqoop等。你甚至也可能被安排做安装系统、部署软件、配置环境、同步数据等一些琐碎的工作。 关于这些,如果你非常感兴趣,可以考虑往大数据平台方向发展,成为数据开发工程师、数据平台运维工程师、或者数据平台架构师。 你不必理解太深,可仅仅停留在了解层面,但知道这些知识会让你和数据开发工程师、运维工程师和平台架构师沟通起来顺畅很多。 当处理和分析数据时,有些 关于数据的操作是必然需要掌握的 。首先是常见格式的数据导入导出,如TXT、CSV、XLS,然后是主要的数据加工技巧,包括建表/视图、插入、更新、查询、并联、串联、汇总、排序、格式转换、循环、常用的函数、描述统计量、变量,等等。 这些操作很基础,但不简单。你可能经常会遇到各种情况,如花了一个下午时间就是没能把一个很小的CSV数据文件正确地导入到数据库中,不是乱码就是错位,或者两表关联时老是报一些烦人的错误,或者日期字段进行格式转换时出现空值......反正状况百出,防不胜防。 关于这些基础操作,需要不断积累经验,尽量能够做到在不同场景下快速高效地完成,轻松应付。 如果有人已经给你取好了数,而你的工作是分析数据写报告,那么分析技巧首先是你需要培养起来的。对拿到的数据,要时刻保持疑问,不能太乐观,因为别人算好的数据未必完全是你想要的数据,又或者数据质量并不是你想的那样好。 在分析之前,需要进行数据探索,看看数据质量如何。比如,你需要清楚有多少数据量,有什么信息,可衍生什么指标,缺失情况如何,如何填补缺失值,值的分布情况如何,如何处理极值,名义/字符变量是否需要转换,等等。 分析时, 要清楚指标不同形态的含义 ,如绝对值、占比、同比、趋势、均值、标准差,等等。 在这里,我想指出, 数据有对比才有意义 。如果一个穷人捡到100元,他会很高兴,这够他吃好几天了。但如果让一个富人去捡100元,那感觉就不一样了,他可能觉得他不值得这么做,因为用弯腰去捡的时间挣到的钱远远不止这么多。 统计学知识是必须要掌握的 ,这是基础。如果你非数学或统计学专业出身,那么请自学。 另外,也请你一定要 掌握主流算法的原理 ,比如线性回归、逻辑回归、决策树、神经网络、关联分析、聚类、协同过滤、随机森林,再深入一点,还可以掌握文本分析、深度学习、图像识别等相关的算法。 关于这些算法, 不仅需要了解其原理,你最好可以流畅地阐述出来,还需要你知晓其在各行业的一些应用场景 。 关于这些算法,你最好能够 参与关于模型开发的具体项目实践 。那样的话,你就可以清楚关于建模的大概流程是怎么样的,不同算法在建模中有不同,需要注意哪些地方。 如果你打字速度不快,那也最好重视起来 ,这虽然是一个不痛不痒的问题,但也在较大程度上影响你的工作效率,进而影响到你的工作产出,当然也可能因此会影响到你的薪资哦! 另外,还有一些 提高工作效率的小技巧 ,也可以多学多掌握。例如,一些电脑的快捷键,定期保存文件,文件的归类存放和快速查找,等等。 作为职场新人,你不仅需要打磨技术, 纯技术之外的技能也需要不断修炼 。 职场的做事方式方法、为人处事以及一些潜规则,更多时候只能靠悟,说出来就可能不大好了,因此需要不断领悟。毕竟, 悟性这东西是很重要的 。 还有, 沟通 是码农普遍的老大难问题,建议重视起来并加强。 你甚至可以学一下投影仪或打印机怎么用。(说不定可以靠这个技能在老板或同事前面大攒人品哦~~) 如果你有机会和很牛的人在一起工作,那你太幸运了。你可以 多请教优秀的人一些问题 ,也可以平时 多观察那些优秀之人的做事方式、工作习惯 ,看看有哪些好的地方、好的品质值得你学习。只要吸纳进来,就可以转化为你的优点,推动你进步。 我毕业的第三年,看到俞敏洪老师在一些演讲中提及他大学时读了800多本书,很受触动,真正认识到了读书的重要性,于是给自己制定了一年读50本书的计划,什么书都读,三年左右时间,我的心智和心态都发生了很大的改变,完全不一样了。 俗话说:“三人行,必有我师。”每个人都有每个人的优点,对于所遇到的每个人,建议多欣赏别人的优点,少抨击别人的缺点,这样你就可以“兼收并蓄”,逐步塑造更好的自己。 三、3-5年,“技多不压身”,拓展能力边界 当迈过了最初的3个年头后,你的技术越来越好,也做了不少项目,也越来越清楚自己未来的方向,但你也会发现有越来越多的东西还需要去学习和加强。 这个时候,你的知识是零散的,还远未形成体系。你也许还需要花些时间好好 梳理和总结过去几年积累的经验和知识 ,不断沉淀, 形成自己的知识体系和方法论 。在梳理的过程中,你会不断清楚自己有什么,缺什么,哪些地方弱,哪些地方强,未来需要花多少时间补强哪项技能,等等。 你可以沿着数据的整个流程,即数据采集、数据存储、数据处理、数据分析/开发模型、报表计算、数据可视化,不断拓展自己的能力边界, 最好在流程中的各个环节都做过项目 。 例如,在数据采集环节,你可以学一下爬虫技术。 这个时候,你不再是新人。新人大多是等着别人安排工作,并在详细的指导之下完成。而你慢慢成长为老司机了,需要独立完成一个个任务了,如独立开发一个模型、写一份会员分析报告、梳理关于近期营业额下降原因分析的思路,等等。你 需要不断适应在无人指点的情况自己去寻求问题解决办法 ,也可能需要应对此前没有遇到过的新情况并独立展开调查研究。几乎没有人帮你,你也没法指望别人明确告诉你怎么做。而你需要的是,历经3年之后成长路上的一个质变。 在这过程中,你可能需要不断查找资料,咨询别人,并加以思考,梳理出有效的方案,最后落地执行。在这过程中,可以有效训练以下几方面的能力: 查找资料 会问问题 总结梳理 写作能力 关于总结梳理,建议定期做,常常做,每天做,建议养成一个日常习惯。 对于不同问题和场景的思路整理总结,常常需要方法论指导,如麦肯锡金字塔原理、结构化思维等。关于这些方法论,不仅要谙熟于心,也需要将其应用到实际工作当中。这是受用一生的知识,你也可将其运用到你的日常生活中,用以解决你日常的问题和需求。 关于思路的整理,可以 借助思维导图工具 。 另外,请注重 培养自己的数据敏感性和数据思维 ,越早开始越好。关于如何培养数据思维,将以另外的文章单独阐述。 EXCEL是操作和处理数据最方便的工具,也是必须掌握的办公软件。很多人会用EXCEL,但根本不精通EXCEL。 简历里那句“精通EXCEL等办公软件”(你的简历里是否也这样写~~),常常是一个谎言 。建议你 好好学一下EXCEL ,包括展示数据、透视表、函数、画图、动态图表、VBA等。不要仅仅停留在最粗的层面,比如画图,使用默认设置也可以画出一个图表,但是不好看,阅读体验不好。关于怎么用EXCEL画好图表,推荐阅读《EXCEL图表演示之道》、《最简单的图形与最复杂的信息》。 写分析报告,难免会用到PPT。关于如何 写好PPT 这件事,从来就不是件轻松的事。但你可以给自己一些时间去学,比如3年、5年、甚至10年。刚开始,写得不好没关系,但一定不要放过每一次锻炼的机会。 关于PPT的技巧,将有更多的文章单独阐述。 在领导眼里, 会写材料的人比会编程的人更有存在感 。而且,会写材料的人总是显得那样“稀缺”。如果你是别的同事眼里的“会Coding的人中最会写PPT+会写材料的人中最懂技术”的那个人,那你将会很受重用。 四、5-10年,“不忘初心”,有所为有所不为 在别人眼里,数据分析和开发模型是很高大上的。但这高大上,常常处在很多尴尬的处境。数据分析汇报一次之后就没了下文,模型开发了,部署了,也定期出数了,但就是没用起来。用户方或业务方觉得这些东西对他们业务帮助不大,可有可无(虽然包装一下用来忽悠一下投资人可能也有点用处),还不如一个经验规则来得有效,简单粗暴,省时省力。 关于经验规则和算法模型之争,如果你坚定认为你开发的模型比业务方所认为的经验规则更有效,那么,请你拿出“证据”,用数据说服业务方,让他们改变观念,觉得你是对的。 之前信奉的那句“数据驱动业务”,是不是错了吗? 此刻,请回到初心吧!我们的初心是什么?那就是用数据帮助业务解决问题,用数据辅助业务决策。数据分析只是其中一种形式,当然还有其它。因此,不要迷恋数据分析,不要迷恋算法模型。“不管黑猫白猫,抓到老鼠就是好猫。” 如果你能够从数据分析和算法模型的困囿中挣脱出来,那么你将发现你面对的是广阔天地,你可以在数据的海洋里肆意遨游 。 你或许开始注重 追求数据解决方案的实用性,强调落地执行,更看重应用效果 。 你 必须真正理解业务方的需求 。当业务方进行选品和定价时,他们需要一份关于竞品的商品数据来做参考;当业务方想随时看到当前时刻的订单量(特别是618或双11),你需要实时汇总数据并实时呈现给他们;当业务方既想看总体的经营数据,也想看各区各部门各门店的经营数据,你需要开发一个多维度层层钻取查看的功能......而这些都不是数据分析和算法模型,但这些也是数据应用,也能产生数据价值。 如果有机会,不妨尝试 做个数据产品经理 。数据产品经理需要从产品角度实现业务功能。在当前数据产品化的趋势下,这是一个很有挑战性的事情,不容易做好。毕竟,讨好一大群用户,比单独讨好一个用户要难得多。 在数据产品设计里, 数据可视化 是一个重要的事情。 好的图表会说话,好的功能会抓住用户的心 。即便撇开数据产品,我们在分析报告里也会需要数据的可视化表达。 数据可视化传递的是一种明确的数据信息,一目了然,赏心悦目。从画好一个数据图表,到功能版式的精心设计,再到对功能细节良苦用心的把握,你需要不断精进。一旦你感兴趣,你将会很快沉迷于其中,因为那是一种美的表达。 五、10年+,“砥砺前行”,创新、创业、创造 是的,你已经做了十年,希望你无悔当初的选择与坚持。 此时你也遇到很多瓶颈,或许你空有一身好武艺但得不到老板重用,或许你想做个实力派但处于各种原因离技术越来越远,或许你很努力但职务仍然上不去,或许你面对繁重的工作心有余而力不足,各种分身乏术......你一直在等待和寻找着机会,突破自己。 此时你也渐渐步入了中年,或许你开始变得油腻,或许你的身材早已远离苗条,或许岁月在你的脸上、头发上开始留下痕迹,或许你的思想渐渐固化,不能与时俱进了......最重要的,或许就是你早已没有了当初的激情。 如果你在一个行业待了十年,在别人眼里,无论怎样,都已是个专家,所以,请自信! 你还需要在圈里有一定的影响力,需要 树立个人品牌 ,最好能在圈里外有较好的传播。如此这样,当别人提起你的时候,他们常会这样说,“这个人分析能力很强”,“他在数据领域造诣很深”,“他建模能力出众”......如此种种,在他们眼里对你印象最深刻的标签将会是你最想要的那个。 或许你需要逐步 提升讲课程的能力 ,这是一种知识分享与传递,也是提高个人影响力的有效途径。不要放过任何露脸的机会哦! 你或许已经深刻明白,分析的结果、开发的模型、数据产品只有被应用起来,才真正算是产生价值。你会越来越 关注数据应用 的问题。当你开始聚焦这个问题时,你会问自己,”用户或业务方真正需要什么?“这个时候,你得有用户思维了。你会加强对业务的重视程度,也会不断 回到业务层面去思考数据的实际应用 。 你最好也时刻 关注当前社会的趋势和潮流 ,特别是与互联网相关的。这样可以让你保持开放的心态,洞悉社会的风向,驱动自己的思考,挖掘潜在的机会。你可以从中了解当前行业中成功的数据应用案例,开拓自己的思路,多想想用数据还可以帮助各行业解决什么问题,可能的机会在哪里,自己应该怎么做。 你可能要面对的是,数据应用对一个行业或一个企业来说,永远都是在探索。某个数据应用思路或项目一旦成功了,就会得到越来越多的资源投入,越做越大,如果失败了,就会立刻遭放弃。因此, 要有创新精神 ,要有创新的勇气和自信。 职位上来说,你可能开始担任一定的管理工作。因此,你还得学会 团队管理 , 懂得如何向上管理和向下管理 。 你的日常事务会越来越多,你也需要学会 有效管理自己的时间 。你可以成为一名“ 清单控 ”。但必须指出的是,时间管理,最本质的还是自我的管理,对精力的管理。你需要开始意识到加强身体锻炼的重要性了。一来,保持身材,对发福说不,二来,保持精力的旺盛,抵抗疲倦,第三,通过不断挑战自己的身体极限来刺激自己,找回激情。 你也需要开始认真考虑如何 平衡工作和家庭 的问题了。 这个世界一直在变。我们也一定要“善变”,顺势而为。 不管是10-20年前的BI(商务智能),过去几年的大数据,这年头炒得火爆的人工智能,还是未来涌现的更多概念,只要我们足够开放,敏感洞察,挖掘机会,创新、创业、创造,不断成就自己。 汪国真在《热爱生命》里写道:“我不去想是否能够成功,既然选择了远方,便只顾风雨兼程。” 英雄不问出身,只要你下定决心,即使再晚出发,也会达到,还可以走得更远。 最后,作为数据人,与你共勉,“ 不做数据的搬运工,要做价值的缔造者 ”。
个人分类: 技术/职场|0 个评论
分享 如何快速成为数据分析师?
lisasister 2016-9-5 10:32
不同行业不同公司要求会很不一样,比如说银行做数据分析、建模会要求 SAS/SQL,而互联网行业数据分析只要会 SQL 就可以了。再比如说小公司可能会要求还会 R/Python 什么的,但是稍微中型一点的公司比如说 Facebook 只需要会 SQL 就行了。乍一看有点奇怪,但其实也不奇怪,因为大一点的公司基础设施 (infra) 做得好,很多事情比如说 A/B test 这种都自动化了,不需要专门写代码。 接下来的内容都搞照中型以上互联网公司为例。 数据分析师需要三个方面的能力:技术(编程),数据分析方法,行业知识。 1. 技术 技术方面刚刚说了,就是SQL, 20 个小时,假设文科生,同时对自己要求高一点,最多 80 个小时可以搞定了。 重点需要注意的:where / group by / order by / left join / right join / inner join / null / not null / having / distinct / like / union / avg / sum / min / max 学完之后再搜索一下 "SQL hardest questions", 做做练习。 当然除了 SQL 之外,Excel 也是要会一点的。不过 Excel 这玩意儿基本多少都会那么些吧,比如说做个图,算算总合、平均之类的,稍微复杂点的数据透视表 (pivot) 就够了。话说我第一份工作的时候连数据透视表都不会,所以说如果你不会这个,那也没关系。 如果 SQL 上手比较快,时间充裕,那就练练 Tableau, 主要目的是看看都有什么样的图表,感受一下各自适用什么样的场景。具体怎么做图不是非常重要,真要用的时候搜索一下现学就好了。Tableau 很贵,所以下个试用版的就可以了,然后试用期学点最基本的就可以了。 这一共就假设用了 80 个小时吧,那么 8 天过去了(没算错,都要速成了,那还不每天学习 10 个小时)。 2. 数据分析方法 经常被问到学习数据分析推荐哪些书,通常答案是我没看过什么数据分析的书,后来仔细想了想,还是有一些的。 Case in point. 经典的管理咨询的书,哪个版本的都无所谓了,印象中大概看了一半左右。好像是因为懒,所以没看完,也因为套路都是类似的,看一半也就差不多可以了。 -- 5 天 Introduction to Probability Models by Sheldon M. Ross. 应该是出到第 11 版了,但内容应该区别不大,看第一章就可以了,需要搞清楚条件概率,这个概念还是有点重要的。-- 4 天 然后再找本统计基础的书(随便哪本教科书都差不多,实在不行的话把 wiki 上统计长条目下的多看几遍也可以),不要太纠结于理论、证明, 时刻记住你要能把这些概念解释给不懂统计的人听,解释不清楚的东西你也不用搞清楚。 搞清楚几种常见的分布,假设检验,假阳性,假阴性,区别估算,显著性差异,p-value,平均值,中位数,p1/p25/p50/p75/p99,相关性,因果性,幸存者偏差,大数定律,80/20。-- 10 天 Thinking, Fast and Slow. 当科普书看看就好,如果看不下去的话那就看《牛奶可乐经济学》。-- 2 天 3. 行业知识 很不幸,这一部分就真的没有什么书可以看的了,基本都靠搜索,总结,思考,再搜索,总结,思考。。。 如果平时对互联网、科技行业相对比较关注,这一部分会上手很快,了解一些基本概念,试用一些产品,基本上 20 天肯定可以了。 基本上把这些搞清楚,也差不多可以入门了吧。
个人分类: 大数据|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2020-4-6 18:42