楼主: 人脉引爆点
5408 3

[学科前沿] 企业数据应该如何处理?预分析和建模工作需要注意哪些问题? [推广有奖]

编辑管理员

已卖:148份资源

学术权威

30%

还不是VIP/贵宾

-

TA的文库  其他...

大数据 |SAS/SPSS数据统计分析师

威望
2
论坛币
1220 个
通用积分
8137.3571
学术水平
360 点
热心指数
388 点
信用等级
316 点
经验
112543 点
帖子
921
精华
5
在线时间
8959 小时
注册时间
2012-3-31
最后登录
2025-12-25

楼主
人脉引爆点 在职认证  发表于 2012-9-12 15:34:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

    企业数据是指所有与企业经营相关的信息,包括产品信息、经营活动等。

       企业数据的获取渠道,一般是由ZF部门发布,像统计局网站公布的数据、科研机构建立的数据信息网站等其他的一些专业数据库也提供这方便的数据,例如国泰安、ccerdata等专业做数据库的,不过不管是数据库还是网上公布的数据,其内容一般不够精细。尤其在我们对这些数据的进行汇总处理时,很可能遇到数据库间格式的不一致等问题,例如对同一个问题,报告的时间不同,甚至是计算的方法不同导致的结果有一定程度的区别。这些问题都可能使数据清理的结果不一致。这要求数据分析人员对这些问题保持一定的敏感度,更多的要结合企业的实际需求来进行数据处理。

       另一类的数据收集问题。因为商业性企业数据一般有企业的专门部门负责收集、加工整理并发布,是作为有偿发布的,用于发布的信息并不是很全,但做为企业内部的统计分析使用时,记录的还是非常详细的。这类数据在清理上也是很麻烦的。因为它有很多的格式需要调整。不过相对来说,其数据信息价值要更高一点。它的特点是即使很琐碎的子信息也可能探索出商业价值。

       企业数据处理的价值在于探索客户动向,开拓销售渠道,寻找潜在的客户,而不在于统计模型的难易程度。这里所强调的是数据分析的精细度。这就要求无论是数据的预分析还是建模工作都要求恰到好处的处理每个细节,所谓恰到好处的要求,不仅仅需要分析人员的统计学背景,还需要行业的专业背景,或相关项目支持人员的协助。如果统计模型失去了行业背景,模型就失去了意义,这时充其量只能算为方程,没法为企业创造价值。


      那么这些问题在SPSS里面应该通过怎样的操作才能实现呢?预分析和建模工作都应该注意哪些问题?

      9月22日—25日SPSS数据统计分析师认证培训,丁老师将逐一为大家解答。


   针对数据收集方面,课程大纲安排如下:

    2.数据的输入与保存

    2.1 数据获取:

    2.1.1 单选题、多选题与开放题的数据的录入。

    2.1.2 spss不同文件格式及外部数据(非spss数据格式)的导入。

    2.2 个体水平数据集(宽型数据)与测量水平(长型数据)数据集的异同。


   针对预分析和建模工作的精细度方面,课程大纲安排如下:

    3. 数据的预分析3.1 数据的选择、合并与拆分、检查异常值。

    3.2 新变量的生成(包括变量的重编码技术)。

    3.3 使用spss变换数据结构、spss函数

    3.4 常用的描述性统计分析功能,包括:frequencies过程、descriptives过程、explore过程等

    3.5 使用spss绘制常用统计图形,包括条图、线图、散点图、交互式作图入门等.  
    4.1 假设检验

    4.1.1 假设检验的原理

    4.1.2 均值的显著性检验

    4.2 差异分析及相关分析过程

    4.2.1 均值过程、T检验与方差分析

    4.2.2 卡方分析

    4.2.2.1 卡方分析原理

    4.2.2.2 卡方分析应用

    4.2.3 相关分析

    4.2.4 偏相关分析

    4.2.5 距离分析

    4.3 回归分析基础

    4.3.1 简单回归分析

    4.3.2 多元回归分析

    4.3.2.1 逐步回归

    4.3.2.2回归预测与残差分析

    4.3.2.3方差不齐的处理—加权最小二乘法与最小一乘法

    4.3.2.4共线性的处理—岭回归(ridge regression)

    4.3.2.5注意问题

    4.3.3 logistic回归分析

    4.3.4 曲线估计

    4.4 因子分析与聚类分析

    4.4.1 主成分分析与因子分析

    4.4.2 快速聚类法与聚类法

    4.4.3 判别分析

    4.4.3.1 判别分析简单示例

    4.4.3.2 贝叶斯判别分析

    4.5 对应分析

    4.5.1对应分析原理

    4.5.2简单对应分析

    4.5.3多重对应分析

    4.5.4案例分析

    6:企业选址的区位分析

    4.6bootstrap技术

    4.6.1bootstrap原理

    4.6.2bootstrap应用

    4.6.3bootstrap功能在SPSS中的实现


   另外课程还包含数据统计分析报告的制作:

    5. 使用SPSS制作数据分析的统计报表

    5.1 制作报表前对变量的检查

    5.2 制作报表的中对不同类型的数据处理

    5.3 报表生成功能与其他选项的区别

    5.4 注意事项

    整个课程体系完整,理论与实际相结合,还能轻松获得证书,为各位学员实际工作或者拿Offer提供有利的保证。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:企业数据 Logistic回归分析 frequencies descriptive logistic回归 ZF部门 统计局 敏感度

沙发
ourfather 发表于 2012-9-12 15:44:29
很值得学习!



藤椅
hqs00000 在职认证  发表于 2012-9-12 15:47:14
呵呵  更喜欢R
失去的东西太多了!

板凳
资料狂人 在职认证  发表于 2012-9-12 15:59:42
喜欢杜老师的课


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 01:24