楼主: cbw1243
44331 504

[问答] 接受各种R语言难题   [推广有奖]

331
philomochi 发表于 2016-9-19 21:04:41
用R做大量数据的回归分析的时候才发现的问题。随机生成了1000000个自变量x和因变量y进行逻辑回归,result<-glm(y~x,family=binomial),为什么得到的result变量竟然有400多m!难道其中是包含了每一步中间过程迭代的结果吗?如果是的话,要怎么只得到想要的部分(系数和P值)呢?
PS,因为电脑的内存有限,在做这样的百万级别的数据分析时发现内存不足了,希望能得到解决的方法

332
512541859 发表于 2016-9-22 18:06:54
您好!我做题组方面的研究,但是不擅长算法和写语法问题。我有一批这样的实证数据,4个题组,每个题组有5道题。我用的是双因子模型,采用SCORIGHT3.0估计出了每个题组的题组效应,但是需要以下这些指标来评价参数估计精度:Bias,绝对偏差MAE,误差均方根RMSE,估计值和真值之间的相关系数,95%置信区间对真值的故该比例(CP),95%置信区间的长度,这个需要另写语法,这些拟合指标的语法用R怎么写呀,或者你有推荐的R包可以参考么?

333
我是纽扣 发表于 2016-9-23 15:39:30
大神您好,我有个问题想打扰您一下,请问用R语言怎样对几十个m*n矩阵进行分类,具体说就是96个4*10000的矩阵进行分类?最好用三种不同的方法。我想用支持向量机,可惜刚接触,一窍不通,需要大神慷慨相助,再次谢谢您了。

334
zwj0323 学生认证  发表于 2016-9-24 16:47:05
对一组300个样本点的数据进行核密度估计,得到的是核宽bw,和512个按升序排列的x点及512个y值,如何得到原样本点对应的概率密度估计值呢?是只能找到样本点所属的概率区间?还是通过得到的核宽,自己编写核函数求样本点对应的概率密度值呢?望楼主赐教啊!!!

335
进行式 发表于 2016-9-30 10:41:01
请问,R运行函数polygenic_hglm时报错“Error in .local(x,...):cs sqr failed"该怎么解决啊?是什么原因造成的呢?谢谢了

336
风之将尽 学生认证  发表于 2016-9-30 15:28:20
请问现在Rweibo还能用吗?如果不能了还有什么其他的方法能够抓取微博的文本数据呢?

337
几何战争 发表于 2016-9-30 18:23:42 来自手机
cbw1243 发表于 2016-6-26 09:15
暑假漫长,生活没有挑战。在此征集各类R语言疑难杂症,欢迎各位骚扰。
提出给力问题的,将予以100论坛币奖 ...
想问一下楼主,有啥入门书籍推荐没????这个问题不难,不要嫌弃

338
刺客王朝 学生认证  发表于 2016-10-1 08:50:39
楼主,请问R怎么做面板,特别是个体效应模型,比如固定效应个体模型?

339
@http://-第七地 在职认证  发表于 2016-10-10 11:48:07
R语言登录网站,爬取数据!要那种登录后才能看到数据的网站

340
jameschin007 发表于 2016-10-11 16:54:58
求助一下吧。

我有一个df, 里面有FactVal, PredValue_Fix,分别是实际值和预测值。现在我算命中率。
用sqldf,写了这样的sql,这个sql在mysql里肯定没问题。但是貌似sqldf这个包不支持 if或者iif函数。
请问肿么办呢。 我希望用sql解决问题,又不想把数据导到数据库里,在dataframe 和database里倒来倒去。

sum_df = sqldf('select FactVal,sum(IF(FactVal=PredValue_Fix,1,0)) as HitNum, sum(IF(FactVal<>PredValue_Fix,1,0)) as NoHitNum from Fact_Pred group by FactVal')

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 19:43