楼主: SSRbao
649 9

[数据求助] 对期刊数据来源存在疑问 [推广有奖]

  • 0关注
  • 1粉丝

本科生

83%

还不是VIP/贵宾

-

威望
0
论坛币
44 个
通用积分
0.1515
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
563 点
帖子
93
精华
0
在线时间
82 小时
注册时间
2021-1-11
最后登录
2022-2-24

楼主
SSRbao 在职认证  学生认证  发表于 2021-8-23 07:29:29 |只看作者 |坛友微信交流群|倒序 |AI写论文
10论坛币
图一所示,是我看到一篇期刊的变量定义表与数据来源说明,其中作者用"环渤海动力煤价格指数”代表煤炭价格。(另:作者对控制变量的描述一带而过,没有展开说明)
图二是百度百科对环渤海动力煤价格指数的描述,显示为周度发布,另外我电话联系煤炭市场网的工作人员,他们说环渤海动力煤价格指数是周度发布的。
作者选择跨度四年的数据,称有效样本为621个,在我理解,如果环渤海动力煤价格指数是周度发布的,有效样本无论如何也无法达到621个,我查阅WIND数据库也没有这项数据,煤炭市场网也只是周度数据,所以请问各位前辈,是我哪里理解错了吗,还是作者进行了什么处理?
(附件里有原文,有兴趣可以查看)
非常感谢您的帮助!

图一
e121df8a3c296d04538b48e2d5bfba3.png

db097a0d3567c7e5e7512eb36c1f449.png

碳排放权价格对能源企业股价的影响_省略_于传统能源和新能源企业的对比分析_卜文珂.pdf

1.6 MB

碳排放权价格.xls

275.5 KB

需要: 20 个论坛币  [购买]

关键词:数据来源 非常感谢您的帮助 wind数据库 wind数据 感谢您的帮助
沙发
SSRbao 在职认证  学生认证  发表于 2021-8-23 18:06:32 |只看作者 |坛友微信交流群
啊啊啊,被这一个数据给堵住了,快来银儿啊,拜托了

使用道具

藤椅
SSRbao 在职认证  学生认证  发表于 2021-8-23 19:12:29 |只看作者 |坛友微信交流群
像是发表在价格理论与实践上的文章应该是很严谨的吧,那为什么我找不到环渤海动力煤价格指数的日度数据呢?原文说的wind上并没有

使用道具

板凳
wdlbcj 学生认证  发表于 2021-8-25 15:15:39 |只看作者 |坛友微信交流群
看了一下文章,感觉可能是理解的问题,这里的数据频率是日度的,主要考虑的是存在交易的时间点,没有交易的时间就剔除了,所以一共这么多。至于这个煤炭价格指数,这个是作为控制变量的,主要是控制交易日那一段时间内的能源价格,所以并不需要日度的频率

使用道具

报纸
SSRbao 在职认证  学生认证  发表于 2021-8-25 17:38:11 |只看作者 |坛友微信交流群
wdlbcj 发表于 2021-8-25 15:15
看了一下文章,感觉可能是理解的问题,这里的数据频率是日度的,主要考虑的是存在交易的时间点,没有交易的 ...
您好,感谢您对帖子的关注!我的想法是动力煤价格指数这一个变量数据是月度的,那么,一年按52周计算,原文是跨度四年,52×4=208,动力煤价格指数的数据大概为208个。这样不就限制了样本数量了吗?因为不论其他变量数据再多,只要是变量缺失的就不是有效样本。如此一来,原文所说的621个有效样本就不存在了。不知道我这样理解对不对?还请您为我指正,谢谢!

使用道具

地板
wdlbcj 学生认证  发表于 2021-8-25 17:51:08 |只看作者 |坛友微信交流群
SSRbao 发表于 2021-8-25 17:38
您好,感谢您对帖子的关注!我的想法是动力煤价格指数这一个变量数据是月度的,那么,一年按52周计算,原 ...
你好 感觉不是你这么理解的,这里不需要保证所有的变量都是一个时间频率,可以用不同的频率来回归分析。

使用道具

7
SSRbao 在职认证  学生认证  发表于 2021-8-25 18:18:27 |只看作者 |坛友微信交流群
wdlbcj 发表于 2021-8-25 17:51
你好 感觉不是你这么理解的,这里不需要保证所有的变量都是一个时间频率,可以用不同的频率来回归分析。
您的意思是时间序列里,某个变量缺失不会影响样本总量是吗?那么在Excel中我是不是只要将缺失的日期空着就好了?621个有效样本实在不知道怎么来的[cry][cry]

使用道具

8
wdlbcj 学生认证  发表于 2021-8-25 21:01:47 |只看作者 |坛友微信交流群
SSRbao 发表于 2021-8-25 18:18
您的意思是时间序列里,某个变量缺失不会影响样本总量是吗?那么在Excel中我是不是只要将缺失的日期空着就 ...
可能是我没解释清楚。换个角度来想一下,这里的被解释变量是日度的,四年中有交易的记录是621天。然后你需要一些相关的控制变量,比如大盘之类的数据,碳排放交易当天不一定有这个煤炭大盘指数的数据,但是有上一周的数据,这个是文中控制变量的由来。

关键在于变量之间的频率不一定要完全相同

使用道具

9
SSRbao 在职认证  学生认证  发表于 2021-8-26 10:50:30 |只看作者 |坛友微信交流群
您的意思是缺失的日度数据就以上一周的周度数据代替就可以了是吗?感谢您的耐心解答

使用道具

10
SSRbao 在职认证  学生认证  发表于 2021-8-31 09:32:48 |只看作者 |坛友微信交流群
我在想作者是不是用“tsfill”去填充了数据,对于这个命令我还没有足够了解,只是作者没有说明,@wdlbcj同学说的我能理解,但文章不可能无中生有增加数据,截图中作者也提到了“剔除交易日缺失数据,'最终'有效样本为621个”,所以我认为不能理解为像wdlbcj同学说的那样,“被解释变量有交易的记录是621个”,621是最终的样本数量,事实上,除了环渤海动力煤价格指数动力煤价格指数以外,其他的样本数量均能达到1100以上,即使剔除缺失数据的交易日,样本也达到了1000多,在没有办法知悉作者对数据的处理方法之前,我尝试着用其他的煤炭价格指数法取得代替,比如“郑州煤”、“大连煤”,这些价格指数是记录了日度数据的,并且在其他文章中也被用作相同含义的代理变量。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 22:26