楼主: 资料狂人
25026 101

[王汉生] 北大光华王汉生(高维数据分析,搜索引擎营销)5月17日在线访谈    关闭 [推广有奖]

31
315525625 在职认证  发表于 2013-5-16 16:38:32

32
648189689 发表于 2013-5-16 17:24:51

33
yuyuan_18 发表于 2013-5-16 18:19:32
学习,学习

34
deng203 发表于 2013-5-16 19:08:26
成果颇丰

35
jimfang9 发表于 2013-5-16 19:09:45
王老师,我想问下主成分回归分析中的变量选择问题,选择多少个合适,是不是把能放进去的变量都放进去?

36
bluesoullvera 发表于 2013-5-16 19:28:04
好多论文啊!

37
megan78 发表于 2013-5-16 19:31:20
王教授您好,现在做横向课题时经常会发生数据处理结果与预期大相径庭,我个人觉得数据收集的质量特别重要,而后期的处理现在越来越复杂反而会影响数据对事件的支撑作用,请问您的看法
已有 1 人评分论坛币 收起 理由
资料狂人 + 50 鼓励积极发帖讨论

总评分: 论坛币 + 50   查看全部评分

38
楚韵荆风 学生认证  发表于 2013-5-16 19:33:42
强烈的支持这种活动。我也想请教一下王教授:
曾经有幸听过您在我们学校做的报告。
最近拜读了您写的几篇超高维的文章,收获很大,尤其是方法的思想上,受益匪浅。
(1)据我个人有限的知识,大多数文章认为超高维指的是变量个数呈指数阶增长,而非多项式阶,即p=O(exp(n^c)),这里c>0,也就是通常的NP问题,而在理论的证明中却限制c满足:0<c<1, 然而,有文献称log(p)/n 趋于0(即0<c<1的情形)只属于高维情形,而非超高维,在理论上如何真正做到c>1或者c>>1的情形?
(2)对于p>>n,通常是对变量先进行筛选(screening) 然后在进行估计,现在是否能够办到对于超高维数据同时进行筛选和估计?
(3) 就目前您所了解的研究现状而言,您能否介绍一下处理超高维数据已经出现了哪些方法(除了SIS, Forward regression)
(4) 有文章提到,通常在模拟中表现得非常好的方法却在预测上并没有表现出优势,请问这主要是哪些原因造成的?这是否可以说明模型的sparsity assumption在实际数据中并不能很好的被满足。

谢谢!




已有 1 人评分论坛币 收起 理由
资料狂人 + 50 鼓励积极发帖讨论

总评分: 论坛币 + 50   查看全部评分

共享是一种彼此的快乐

39
gagarin61412 发表于 2013-5-16 19:34:46
支持
微博:@VincentAnton 简介:惠灵顿维多利亚大学会计硕士+华东理工管理学学士+通过CFA2级+09年通过司法考+11年过FRM第一部分+雅思7分+GMAT 680+6年半ZF工作经验。求职:长三角金融行业或证券法律业

40
danjourney 在职认证  发表于 2013-5-16 19:58:08
王教授,你好!我想问问就是如何处理变量比样本多的时候的数据情况,比方说经济社会方面的评价分析一般都会涉及到很多评价指标即变量,但是可用的样本数据又相对比较少,这种情况下怎么对数据进行降维和评价分析处理,谢谢王教授的指点!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 09:27