楼主: 201705080128
1906 10

[数据管理求助] stata线性差值法得出数值为负数 [推广有奖]

  • 0关注
  • 0粉丝

高中生

92%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
5.4967
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
432 点
帖子
24
精华
0
在线时间
29 小时
注册时间
2021-11-2
最后登录
2024-9-23

楼主
201705080128 发表于 2024-4-5 20:58:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
采用线性差值处理缺失值,得出数据为负数,理论上不应该是负数,这个要怎么解决
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 处理缺失值 缺失值

1899bc8a8b7d56065b3a7db446e42eb.png (11.79 KB)

1899bc8a8b7d56065b3a7db446e42eb.png

沙发
wdlbcj 学生认证  发表于 2024-4-7 12:50:25
你注意看一下 你这里是不是不同省份的情况 不能随便插值

藤椅
201705080128 发表于 2024-4-14 15:36:47
wdlbcj 发表于 2024-4-7 12:50
你注意看一下 你这里是不是不同省份的情况 不能随便插值
不是不同省份的

板凳
wdlbcj 学生认证  发表于 2024-4-14 16:42:12
201705080128 发表于 2024-4-14 15:36
不是不同省份的
你的数据要描述更清楚一些

以及你的插值的方法
这样有利于帮你想一下如何解决

报纸
201705080128 发表于 2024-4-14 20:44:30
wdlbcj 发表于 2024-4-14 16:42
你的数据要描述更清楚一些

以及你的插值的方法
好的好的,非常感谢您的回复

地板
201705080128 发表于 2024-4-14 20:49:26
201705080128 发表于 2024-4-14 20:44
好的好的,非常感谢您的回复
这个不是不同省份的,然后我用的代码是
by id:ipolate 互联网宽带接入用户万户 year ,gen(i互联网宽带接入用户万户) epolate ,
是不是因为这个不能用在前几年是缺失情况下,但是这个数据在2008-2010都是没有数据的,如果遇到这种前几年都没有数据,但自己又想要,需要怎么办呢。

谢谢您之前的回复

43a19ec79bc866f60bbdc13d950460c.png (120.7 KB)

43a19ec79bc866f60bbdc13d950460c.png

7
201705080128 发表于 2024-4-14 20:53:15
wdlbcj 发表于 2024-4-14 16:42
你的数据要描述更清楚一些

以及你的插值的方法
这个不是用不同年份的,然后我用的代码的是by id:ipolate 互联网宽带接入用户万户 year ,gen(i互联网宽带接入用户万户) epolate

是不是因为这个数据都是前几年缺失,所以不能这样处理数据。
那如果我就是需要这个数据但是前几年缺失,这个要做怎么处理?

43a19ec79bc866f60bbdc13d950460c.png (120.7 KB)

43a19ec79bc866f60bbdc13d950460c.png

8
wdlbcj 学生认证  发表于 2024-4-15 18:25:07
201705080128 发表于 2024-4-14 20:53
这个不是用不同年份的,然后我用的代码的是by id:ipolate 互联网宽带接入用户万户 year ,gen(i互联网宽带 ...
你好
这里的关键点是 你要确定好
前几年数据是存在的?
万一没有呢?
或者说 万一没有你猜测的那么多呢

9
201705080128 发表于 2024-4-25 10:18:19
wdlbcj 发表于 2024-4-15 18:25
你好
这里的关键点是 你要确定好
前几年数据是存在的?
你好,你的意思是本身没有就不可以用线性差值法是吗

10
wdlbcj 学生认证  发表于 2024-4-25 13:48:50
201705080128 发表于 2024-4-25 10:18
你好,你的意思是本身没有就不可以用线性差值法是吗
是的,可能中间确实没有数据 或者是之前没有数据 那就不能差值

插值法的假设中间时间都是均匀变动的,但可能实际并不是。有些变量均匀变动假设大家能接受,认为波动不会太大;但有些变量波动就是很大啊,为什么能假设是均匀变化?所以这是那些不怎么好的文章的做法,就随意插值,也是为什么top不太见插值的做法

综上,一般都不用插值法,尊重原始数据,有缺失就有缺失

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-7 15:59