楼主: Cnstopit
1683 7

[问答] 请教大神用R读取CSV时的问题 [推广有奖]

  • 4关注
  • 0粉丝

本科生

29%

还不是VIP/贵宾

-

威望
0
论坛币
2517 个
通用积分
0.7500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1820 点
帖子
77
精华
0
在线时间
81 小时
注册时间
2017-7-11
最后登录
2024-3-31

楼主
Cnstopit 发表于 2017-8-1 23:23:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人小白,读取CSV数据时,在excel里看,数据框架一样的数据,但是列却不一样。这是为什么
> names(data)
[1] "PERMNO"           "date"             "SICCD"            "TICKER"         
[5] "COMNAM"           "NAICS"            "PERMCO"           "CUSIP"           
[9] "NWPERM"           "PRC"              "VOL"              "BID"            
[13] "ASK"              "SHROUT"           "VE"               "D"               
[17] "rating"           "secid"            "cusip"            "optionid"        
[21] "ticker"           "date.1"           "exdate"           "cp_flag"         
[25] "open_interest"    "impl_volatility"  "delta"            "gamma"           
[29] "vega"             "theta"            "maturity"         "secid.1"         
[33] "date.2"           "days"             "volatility"       "cusip.1"         
[37] "ticker.1"         "sic"              "index_flag"       "exchange_d"      
[41] "class"            "issue_type"       "industry_group"   "futvol"         
[45] "date.3"           "ticker.2"         "ccy"              "spread1y"        
[49] "spread3y"         "spread5y"         "spread7y"         "spread10y"      
[53] "compositedepth5y" "sector"           "recovery"         "docclause"      
[57] "tier"             "rate"             "pd5"              "civ"            
[61] "value"            "X"               
> mydata=read.table("E:/CDS dissertation/cds initial/stock 7/stock.1.csv",sep=",",header=T, stringsAsFactors=F)
> names(mydata)
[1] "PERMNO"           "date"             "SICCD"            "TICKER"         
[5] "COMNAM"           "NAICS"            "PERMCO"           "CUSIP"           
[9] "NWPERM"           "PRC"              "VOL"              "BID"            
[13] "ASK"              "SHROUT"           "VE"               "D"               
[17] "rating"           "secid"            "cusip"            "optionid"        
[21] "ticker"           "date.1"           "exdate"           "cp_flag"         
[25] "open_interest"    "impl_volatility"  "delta"            "gamma"           
[29] "vega"             "theta"            "maturity"         "secid.1"         
[33] "date.2"           "days"             "volatility"       "cusip.1"         
[37] "ticker.1"         "sic"              "index_flag"       "exchange_d"      
[41] "class"            "issue_type"       "industry_group"   "futvol"         
[45] "date.3"           "ticker.2"         "ccy"              "spread1y"        
[49] "spread3y"         "spread5y"         "spread7y"         "spread10y"      
[53] "compositedepth5y" "sector"           "recovery"         "docclause"      
[57] "tier"             "rate"             "pd5"              "civ"            
[61] "value"           
>


####第一个data会比第二个mydata 数据多出一个“x”

然后我用RBIND时,多出“x”的CSV表格就会因为列数不一致而无法进行合并,请问如何解决?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:dissertation Volatility composite Industry exchange

沙发
Cnstopit 发表于 2017-8-1 23:23:33
请论坛大神赐教

藤椅
太极无极 在职认证  发表于 2017-8-1 23:38:02
将数据传上来给高手看看,别人才可能给你解答

板凳
GOD.M.W 学生认证  发表于 2017-8-2 01:07:15 来自手机
Cnstopit 发表于 2017-8-1 23:23
本人小白,读取CSV数据时,在excel里看,数据框架一样的数据,但是列却不一样。这是为什么
> names(data)
...
把X那列删除了就行了吧。

报纸
Cnstopit 发表于 2017-8-2 08:12:09 来自手机
GOD.M.W 发表于 2017-8-2 01:07
把X那列删除了就行了吧。
其实X什么都没有,只是列名串了,整体左移了一列,多出来的数据就自动被系统设置为x列。

地板
Cnstopit 发表于 2017-8-2 14:33:19
这是错误的列名和数据对应

360截图20170802143116588.jpg (105.79 KB)

360截图20170802143116588.jpg

7
Cnstopit 发表于 2017-8-2 14:34:59
这是正确的对应。现在错误对应的表格,无法RBIND到总表里面,因为本来61个变量,由于列名向左整体移动了一列,最后一列数据就被自动设为“x”列。

360截图20170802143142113.jpg (106.06 KB)

360截图20170802143142113.jpg

8
糯米JI 发表于 2017-8-3 12:53:13
请上传数据

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-3 07:09