学数据挖掘 老师让我们连续做两个作业都是生成随机集 网上找这方面资料很少 首先训练集 验证集 测试集这些概念有查到解释还没理解 有人说就是生成随机数直接分成三份就行了 不过老师说测试集不必产生结果变量不知有什么特别意思
第二次给我们了10W随机数据 然后好像是在里面挑出20000个数据按正态分布生成上述三个数集 说各比率加总值为1 可能是让每个数集的正态分布情况和为1
这方面老师没解释 所以都靠自己了解 生成随机数其实用excel做都挺方便 老师要我们写sql sas c语言生成 搞的很麻烦 而且还有一点就是sql excel的随机数生成都有个random函数 而其他统计软件的random好像是必须安装一定的分布 像随机正态 随机均匀分布 我感觉这样不够随机 那么单纯这个random函数生成的数可能符合均匀分布 可能是正态分布 可能是二项 几何等分布吗
在论坛下了本书叫 随机与蒙特卡洛里面介绍伪随机 那么伪随机是不是就是这种安装正态或者二项分布产生的随机 就这些问题 请高手帮忙解答一下 网上好像很少资料
当然我有了解到说对随机以及测度论应该有些了解 现在突然感觉老师他真是不给解惑啊 从美国回来的台湾人
本文来自: 人大经济论坛 详细出处参考:http://www.pinggu.org/bbs/viewthread.php?tid=744016&page=1&from^^uid=1216979
发在计量板块无人理睬 转这来看看