初学者,现在手头有组消费者的消费数据,按一定条件人工分类数据。想通过抽样将符合某种特性的消费者挑出一部分,比如参加了活动后中奖还购买了体验品的消费者。然后依此产生满足其他条件的样本,再用这些样本进行分析。假如有变量activity,win,product分别对应是否参加活动,是否中奖,购买何种产品,抽4000个样本。能否用 sample 4000 if activity==1&win==1, count by product==1。这么做是否能保证抽样均值和总体一致从而使后继分析有意义?
自我补充:http://www.ats.ucla.edu/stat/stata/faq/sample.htm,似乎按这个方法可以做到分层抽样


雷达卡






京公网安备 11010802022788号







