〖素质笔记〗三大非参数估计方法——核估计（R实现）

5关注
815
粉丝

已卖：2774份资源

学术权威

83%

还不是VIP/贵宾

-

TA的文库 其他...

〖素质文库〗

结构方程模型

考研资料库

0%

威望: 8 级
论坛币: 23391 个
通用积分: 28308.6707
学术水平: 2705 点
热心指数: 2881 点
信用等级: 2398 点
经验: 228906 点
帖子: 2968
精华: 52
在线时间: 2175 小时
注册时间: 2012-11-24
最后登录: 2024-1-13

楼主

我的素质低

发表于 2015-8-23 10:02:40 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

昨天跟着fantuanxiaot师兄—— [原创]基于R语言的核回归(Kernal Regression)与最近邻回归(NNBR) 的帖子学习了以下，觉得核回归的方式比较原来的必须服从某些假定的回归方法好很多，在网上找了找相关的内容，把找到的内容，分享给坛友~

用于函数估计的非参数方法大致上有三种：核方法、局部多项式方法、样条方法。非参的函数估计的优点在于稳健，对模型没有什么特定的假设，只是认为函数光滑，避免了模型选择带来的风险；但是，表达式复杂，难以解释，计算量大是非参的一个很大的毛病。所以说使用非参有风险，选择需谨慎。

[size=17.3333339691162px] 核方法常见的有Nadaraya-Watson核估计与Gasser-Muller核估计方法。

核密度估计的原理其实是很简单的。在我们对某一事物的概率分布的情况下。如果某一个数在观察中出现了，我们可以认为这个数的概率密度很大，和这个数比较近的数的概率密度也会比较大，而那些离这个数远的数的概率密度会比较小。

基于这种想法，针对观察中的第一个数，我们都可以f(x-xi)去拟合我们想象中的那个远小近大概率密度。当然其实也可以用其他对称的函数。针对每一个观察中出现的数拟合出多个概率密度分布函数之后，取平均。如果某些数是比较重要，某些数反之，则可以取加权平均。

NW核估计形式为：

GM核估计形式为：

# 定义x.y.bw（窗宽）
x <- seq(-1, 1, length = 40)
y <- 5 * x * cos(5 * pi * x)
h <- 0.055

复制代码

# 核估计法一：NW method核估计
fx.hat <- function(z, h) {
dnorm((z - x)/h)/h
}
NWSMOOTH <- function(h, y, x) {
n <- length(y)
s.hat <- rep(0, n)
for (i in 1:n) {
a <- fx.hat(x[i], h)
s.hat[i] <- sum(y * a/sum(a))
}
return(s.hat)
}
NWsmooth.val <- NWSMOOTH(h, y, x)
plot(x, y, xlab = "Predictor", ylab = "Response", col = 1)
f <- function(x) 5 * x * cos(5 * pi * x)
curve(f, -1, 1, ylim = c(-15.5, 15.5), lty = 1, add = T, col = 1)
lines(x, NWsmooth.val, lty = 2, col = 2)
A <- data.frame(x = seq(-1, 1, length = 1000))
model.linear <- lm(y ~ poly(x, 9))
lines(seq(-1, 1, length = 1000), predict(model.linear, A), lty = 3, col = 3)
letters <- c("NW method", "orignal model", "9 order poly-reg")
legend("bottomright", legend = letters, lty = c(2, 1, 3), col = c(2, 1, 3),
cex = 0.5)

复制代码

# 核估计法二：GMSMOOTH估计
GMSMOOTH <- function(y, x, h) {
n <- length(y)
s <- c(-Inf, 0.5 * (x[-n] + x[-1]), Inf)
s.hat <- rep(0, n)
for (i in 1:n) {
fx.hat <- function(z, h, x) {
dnorm((x - z)/h)/h
}
a<- y * integrate(fx.hat, s, s[i + 1], h =
h, x = x)$value
s.hat <- sum(a)
}return(s.hat)
}
GMsmooth.val <- GMSMOOTH(y, x, h)
plot(x, y, xlab = "Predictor", ylab = "Response", col =1)
f <- function(x) 5 * x * cos(5 * pi * x)
curve(f, -1, 1, ylim = c(-15.5, 15.5), lty = 1, add = T,col = 1)
lines(x, GMsmooth.val, lty = 2, col = 2)
A <- data.frame(x = seq(-1, 1, length = 1000))
model.linear <- lm(y ~ poly(x, 9))
lines(seq(-1, 1, length = 1000), predict(model.linear,A), lty = 3, col = 3)
letters <- c("GM method", "orignal model", "9 order polyreg")
legend("bottomright", legend = letters, lty = c(2, 1, 3),col = c(2, 1, 3),cex = 0.5)

复制代码

本帖隐藏的内容

2015-8-23 09:58:49 上传
下载附件 (8.99 KB)

# 两估计方法对比
fx.hat <- function(z, h) {
dnorm((z - x)/h)/h
}
NWSMOOTH <- function(h, y, x) {
n <- length(y)
s.hat <- rep(0, n)
for (i in 1:n) {
a <- fx.hat(x, h)
s.hat <- sum(y * a/sum(a))
}
return(s.hat)
}
NWsmooth.val <- NWSMOOTH(h, y, x)
GMSMOOTH <- function(y, x, h) {
n <- length(y)
s <- c(-Inf, 0.5 * (x[-n] + x[-1]), Inf)
s.hat <- rep(0, n)
for (i in 1:n) {
fx.hat <- function(z, h, x) {
dnorm((x - z)/h)/h
}
a <- y * integrate(fx.hat, s, s[i + 1], h = h, x = x)$value
s.hat <- sum(a)
}
return(s.hat)
}
GMsmooth.val <- GMSMOOTH(y, x, h)
plot(x, y, xlab = "Predictor", ylab = "Response", col = 1)
f <- function(x) 5 * x * cos(5 * pi * x)
curve(f, -1, 1, ylim = c(-15.5, 15.5), lty = 1, add = T, col = 1)
lines(x, NWsmooth.val, lty = 2, col = 2)
lines(x, GMsmooth.val, lty = 3, col = 3)
letters <- c("orignal model", "NW method", "GM method")
legend("bottomright", legend = letters, lty = 1:3, col = 1:3, cex = 0.5)

复制代码

2015-8-23 09:58:50 上传
下载附件 (8.69 KB)

从图中可以看到NW估计的方差似乎小些，事实也确实如此，GM估计的渐进方差约为NW估计的1.5倍。但是GM估计解决了一些计算的难题。

学习于：yujunbeta老师博客,http://blog.csdn.net/yujunbeta/article/details/26058533
小亮老师博客，http://blog.sina.com.cn/s/blog_62b37bfe0101homb.html

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享2 收藏75 回帖

关键词：非参数估计参数估计核估计非参数 R实现表达式多项式模型网上

回帖推荐

niuniuyiwan 发表于9楼查看完整内容

用直方图来估计密度函数的缺点是：即使随机变量是连续的，直方图得到的是不连续的阶梯函数，即不光滑的密度估计，而核密度则有效克服了直方图不光滑的缺点。

已有 11 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
kongqingbao280	+ 100					精彩帖子
271828haha			+ 1	+ 1	+ 1	观点有启发 awesome!
remlus	+ 100					精彩帖子
np84	+ 100					精彩帖子
wwqqer	+ 100					精彩帖子
arthistory4	+ 20					精彩帖子
shyxinanjz		+ 10	+ 3	+ 3		精彩帖子
william9225	+ 100					精彩帖子
xddlovejiao1314	+ 100	+ 100	+ 5	+ 5	+ 5	精彩帖子
niuniuyiwan					+ 5	精彩帖子

总评分: 经验 + 740 论坛币 + 170 学术水平 + 19 热心指数 + 19 信用等级 + 16 查看全部评分

本帖被以下文库推荐

· 经管代码库|主题: 407, 订阅: 25
· 〖素质文库〗|主题: 72, 订阅: 59

心晴

的时候，雨也是晴；心雨

的时候，晴也是雨！
扣扣：407117636，欢迎一块儿吐槽！！

沙发

timesever 发表于 2015-8-23 10:24:01

回帖奖励 +2

顶！
顶！
就是喜欢这类帖子！

已有 1 人评分	经验	论坛币	收起理由
xddlovejiao1314	+ 10	+ 3	鼓励积极发帖讨论

总评分: 经验 + 10 论坛币 + 3 查看全部评分

藤椅

三世相思2013

发表于 2015-8-23 10:36:08

回帖奖励 +2

很好的帖子

已有 1 人评分	经验	论坛币	收起理由
xddlovejiao1314	+ 10	+ 3	鼓励积极发帖讨论

总评分: 经验 + 10 论坛币 + 3 查看全部评分

板凳

niuniuyiwan

发表于 2015-8-23 14:34:52

回帖奖励 +2

好帖，谢谢分享。

已有 1 人评分	经验	论坛币	热心指数	收起理由
xddlovejiao1314	+ 20	+ 5	+ 1	鼓励积极发帖讨论

总评分: 经验 + 20 论坛币 + 5 热心指数 + 1 查看全部评分

报纸

Alfred_G

发表于 2015-8-24 08:15:56

回帖奖励 +2

good~分享之

已有 2 人评分	经验	论坛币	收起理由
niuniuyiwan	+ 10	+ 5	精彩帖子
xddlovejiao1314	+ 10	+ 3	鼓励积极发帖讨论

总评分: 经验 + 20 论坛币 + 8 查看全部评分

地板

xddlovejiao1314

发表于 2015-8-24 11:11:40

回帖奖励 +2

在牛A与牛C之间的路上越走越远了。

已有 2 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
我的素质低			+ 5	+ 5	+ 5	精彩帖子
niuniuyiwan	+ 18	+ 5				鼓励积极发帖讨论

总评分: 经验 + 18 论坛币 + 5 学术水平 + 5 热心指数 + 5 信用等级 + 5 查看全部评分

7楼

海的方向 发表于 2015-8-28 09:28:33

回帖奖励 +2

素质笔记我看行

已有 2 人评分	经验	论坛币	热心指数	收起理由
xddlovejiao1314	+ 10	+ 3		鼓励积极发帖讨论
我的素质低		+ 5	+ 2	精彩帖子

总评分: 经验 + 10 论坛币 + 8 热心指数 + 2 查看全部评分

8楼

诸葛山下 发表于 2015-8-30 10:22:32

回帖奖励 +2

就此帖请教一个问题：已知我获得一组数据（全整数型），按频率画出其直方图。现在我想得到此数据的概率密度函数来拟合一下它的直方图上所体现出的数据分布。经典的做法是在直方图上添加一个正态分布曲线，然而是否有办法直接拟合出数据本身的分布曲线来和正态分布曲线作出对比？
此文提到的核估计适用于解决此问题吗？

已有 1 人评分	经验	论坛币	收起理由
xddlovejiao1314	+ 10	+ 3	鼓励积极发帖讨论

总评分: 经验 + 10 论坛币 + 3 查看全部评分

9楼

niuniuyiwan

发表于 2015-8-30 10:50:40

诸葛山下发表于 2015-8-30 10:22
就此帖请教一个问题：已知我获得一组数据（全整数型），按频率画出其直方图。现在我想得到此数据的概率密度 ...

用直方图来估计密度函数的缺点是：即使随机变量是连续的，直方图得到的是不连续的阶梯函数，即不光滑的密度估计，而核密度则有效克服了直方图不光滑的缺点。

已有 2 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
xddlovejiao1314	+ 10	+ 3				鼓励积极发帖讨论
我的素质低	+ 100	+ 100	+ 5	+ 5	+ 5	精彩帖子

总评分: 经验 + 110 论坛币 + 103 学术水平 + 5 热心指数 + 5 信用等级 + 5 查看全部评分

10楼

律政飞鲨

发表于 2015-8-31 15:14:20

回帖奖励 +2

很好的帖子

已有 1 人评分	经验	论坛币	收起理由
xddlovejiao1314	+ 10	+ 3	鼓励积极发帖讨论

总评分: 经验 + 10 论坛币 + 3 查看全部评分

[R] 〖素质笔记〗三大非参数估计方法——核估计（R实现） [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

本帖隐藏的内容

扫码加我拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

浏览过的帖子

浏览过的版块

一级伯乐勋章

初级学术勋章

初级热心勋章

初级信用勋章

中级热心勋章

中级学术勋章

中级信用勋章

高级学术勋章

高级热心勋章

高级信用勋章

特级学术勋章

特级热心勋章

特级信用勋章

本版微信群

[R] 〖素质笔记〗三大非参数估计方法——核估计（R实现） [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

本帖隐藏的内容

扫码加我 拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

回帖奖励 +2

浏览过的帖子

浏览过的版块

一级伯乐勋章

初级学术勋章

初级热心勋章

初级信用勋章

中级热心勋章

中级学术勋章

中级信用勋章

高级学术勋章

高级热心勋章

高级信用勋章

特级学术勋章

特级热心勋章

特级信用勋章

本版微信群

扫码加我拉你入群