一个小小的小问题:我的样本是我国上市公司,各个行业都有。我从Wind数据库下了行业代码,但都是字母表示的,stata不认,加Dummy的时候咋办呢?
还有,stata中如果某个样本点个别变量数据缺失,用-999替换后,能不能保证stata不把样本点删去呢?另外-999会不会影响系数估计呢?
另外,一个问题想和您讨论,俺们学校滴统计大牛讲课时曾曰:“区分样本总体和子样本是一个易错的地方。”老师举了一个例子:比如研究预开航城市哪些真正适合建机场时,商务部给了100多个预开航城市的名单,这个时候你研究的问题是预开航城市的确定问题,所以这100多个城市就是你的样本总体,总体不是全国的全部城市。
我就在想,那只要我说我研究某某问题岂不是就可以随便自己确定样本总体了么?比如,我研究中小企业,那全部中小企业就是我的样本总体,我研究制造业中的中小企业,那制造业中的中小企业就是我的样本总体??这样太。。。。。
我之所以有这个问题,是因为在Bootstrapping时,您说Bootstrapping一定要random sample,因为我取样时是从中小企业中挑的,那么按我们老师的说法我是randomsample,若认为全部上市公司是样本总体,那我绝对有偏抽样了,用不了Bootstrapping了。希望聆听您的意见