楼主: tom_lv1
619 0

[公告] 随机事例的混合与挑选 [推广有奖]

  • 1关注
  • 47粉丝

院士

10%

还不是VIP/贵宾

-

威望
0
论坛币
93132 个
通用积分
105.5839
学术水平
602 点
热心指数
475 点
信用等级
479 点
经验
54652 点
帖子
1077
精华
21
在线时间
750 小时
注册时间
2016-2-24
最后登录
2024-1-8

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

                   随机事例的混合与挑选

                          于德浩

                        2018.12.19

在数据统计中,我们一般会把一个连续的随机事例序列视为一个统计样本,这实际是一个很强很强的强假设。比方说,我们把第一次掷硬币与第二次掷硬币归为一个统计样本,这应该是没问题的。但是,如果我们把今天的股票价格与明天的股价归为一个样本,这肯定饱受争议。因为,人们都认为,今天与明天的股价应该是强关联而非独立的。还有明显更不合理的统计,比如把一个普通工人的收入与一个亿万富翁归类一起计算平均收入。

就是说,为了统计的有效性,我们应该对事例做筛选。但是,在统计归类时,我们并不知道什么才是“合理的挑选”。一个证伪的方法,就是要进行二次统计迭代反馈。比方说,我们随机采访了10个人的年收入,平均收入是109万元/人。可实际情形是,9个人都是年入10万,只有1个人年入1000万。在这个简单的案例中,我们若对外公布平均收入是109万就是“虽然数字正确,但明显不合理”;而对外公布平均收入是10万,虽然合理但不正确。因此,我们就要进行二次统计,直接剔除那个1000万的特殊事例,“我们共统计了9人,总收入是90万,年均收入是10万。”

当然,现实中的大数据会更复杂,我们无法一眼看出哪些是应该被剔除的特殊事例。我只是说,我们要谨慎,对于统计数据得出的“结论”不要轻信,我们很有必要从另一个角度进行二次统计。

在股价数据的事例统计中,我们一开始肯定是不加筛选的统计连续20天的数据。这虽然不合理,但是一开始就剔除某几天的股价会更不合理。假设,我们统计50ETF股价,有大约10天,股价在2.40-2.45元附近波动;另外10天,股价在2.55-2.60附近波动。

如果作为一个20天的大样本,那么股价期望值(均值)就是2.50元,标准差是0.075。显然,这个结论很不合理。因为,没有一天,股价是在2.50附近;而且,日间波动没有3%那么大,只有大约1%的正常波动。

如果,我们看成是2个10天的随机事例样本的均匀混合,问题就更明了。一个分布的期望值是2.425元,标准差是0.025;另外一个分布的期望值是2.575,标准差也是0.025元。

当然,这个10天的样本,就不是连续的10天了,也许是前5天和中间的5天构成了期望值2.425的样本;而中间5天和最后5天构成了期望值2.575的样本。这在股价走势图上,就显示为,股价开始低位震荡,然后突然一跃而上,高位徘徊;随后猛然下跌,又在低位震荡;最后又迅速反弹至高位,横盘整理。

当我们按照时间轴来看,股价是蓄势-暴涨-暴跌-反弹,这明显是强关联的。但我们按照随机分布来看,每天的股价看成是独立的也无妨。就是说,假定日后股价还是这个分布,我们完全可以股价在2.425元附近时,买入;在股价2.575元附近,卖出。按照股价分布,而不是看时间变化,我们就可以忽略“股价涨跌”。就是说,当股价第一次暴跌进入到2.425元时,我就应该买入;期待股价5天或10天后进入到2.575元附近卖出。

而如果是按照时间预测(猜)涨跌,那么如果第一天就抄底,第二天若不反弹,你就会心慌。或者,一般人们要等到“止跌企稳”后再买入,如果股价突然上窜到2.550元,你要么错过这次反弹,要么追涨被套在高位。

当然,股价随机分布统计的最大缺点就是,我们无法确定股价分布的边界。假如,下一个20天并不是这个股价分布的延续,而是期望值2.7元的另外一个分布。我们在2.575元卖出就是一个巨大的错误。不过,一般我们还是先假定股价分布在延续,还在分布边界以内。

当其中一个分布的混合事例比例太小时,我们就不会看成一个混合分布,而只看成几个应该被剔除的特殊事例。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:平均收入 随机分布 正常波动 年均收入 时间预测

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 23:28