1.1 统计在商务和经济中的应用
统计学在会计、财务、市场营销、生产、经济、信息系统等方面具有重要的作用。
1.2 数据
数据:为了描述和解释所搜集、分析、汇总的事实和数字。
数据集:为了特定研究而收集的所有数据。
1.2.1 个体、变量和观测值
个体:收集数据的实体。例如订单表中的每一个用户
变量:个体中感兴趣的特征。例如身高、体重、年龄、学历等
观测值:对某一特定个体得到的测量值的集合。例如身高180,体重70公斤
1.2.2 测量尺度
名义尺度:类似中国、美国、日本
顺序尺度:类似与第一名、第二名、第三名
间隔尺度:类似学生A成绩600分,学生B成绩500分,差距100分
比率尺度:类似速度、增长率
1.2.3 分类型数据和数量型数据
分类型数据:只用于对数据进行分类,数据之间的运算均是没有意义的,类似与男、女。
数量型数据:进行数据间运算是有意义的,例如小明今年5岁,明年就是5+1=6岁。
1.2.4 截面数据和时间序列数据
截面数据:同一时间节点的数据,例如2021年6月27日,淘宝店各家门店今日销售额
时间序列数据:按照时间进程变化的数据,例如宝马2021年各月度汽车销售情况
1.3 数据来源
现有来源(目前各公司都建立数据库,会收集订单数据、用户数据、产品数据、用户行为数据等大量数据)、观测性研究或实验获得,同时在决定是否进行数据搜集时,应当考虑到成本问题,且数据的质量会在很大程度上影响到分析结果,因此必须保证所获得的数据及时,准确。
1.4 描述统计
描述已发生数据的基本情况,包括平均数、方差、表格、绘制直方图、饼图等形式汇总的统计分析,并不会对未来进行预测。
1.5 推断统计
利用样本数据对总体数据特征进行估计和假设检验的过程。
1.6 逻辑分析方法
统计学分为描述统计与推断统计;依靠数据做出科学决策的方法叫逻辑分析方法,包括描述性分析、预测性分析、规范性分析。
描述性分析:包含描述过去发生状况的分析技术集合,包括描述统计、报告、数据查询、数据可视化
预测性分析:利用过去数据建立模型,预测未来或评估一个变量对另一个变量的影响,包括线性回归、时间序列分析
规范性分析:产生一个最佳模型的分析技术集合