楼主: 林随机漫步
2768 0

[程序分享] R语言 list与data.frame转换 [推广有奖]

  • 1关注
  • 3粉丝

硕士生

7%

还不是VIP/贵宾

-

威望
0
论坛币
154 个
通用积分
102.8396
学术水平
11 点
热心指数
11 点
信用等级
11 点
经验
1957 点
帖子
67
精华
0
在线时间
135 小时
注册时间
2014-1-11
最后登录
2024-1-6

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

背景:下载某数据库的数据做数据分析,发现下载的数据结构是多层list嵌套,与平时遇到的数据表(data.frame)不同,并且第二层list的名称是本人需要的变量。

问题:如何将将第二层的list的名称嵌入到内层(第三层)的数据中,作为变量?

2.png
一、什么是list列表

列表是 R 语言的对象集合,可以用来保存不同类型的数据,可以是数字、字符串、向量、另一个列表等,当然还可以包含矩阵和函数,通常用list()函数创建列表。列表list最大优点:容纳多种类型的数据,可多层嵌套。

  1. > df <- iris[1:10,]
  2. > pts <- list(x = df[,1], y = df[,2])
  3. > pts
  4. $x
  5. [1] 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9

  6. $y
  7. [1] 3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1
复制代码

二、简单列表list与data.frame转换
一般情况情况,as.list()和as.data.frame()可直接实现简单的list和data.frame类型数据的转换。
  • as.list(x)可将数据框x按列转换为多个list
  • as.data.frame(x),可将列表x按列合并为一个数据框data.frame
  1. > df_as.list <- as.list(df)
  2. > df_as.list
  3. $Sepal.Length
  4. [1] 5.1 4.9 4.7 4.6 5.0 5.4 4.6 5.0 4.4 4.9

  5. $Sepal.Width
  6. [1] 3.5 3.0 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1

  7. $Petal.Length
  8. [1] 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5

  9. $Petal.Width
  10. [1] 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1

  11. $Species
  12. [1] setosa setosa setosa setosa setosa setosa setosa setosa setosa setosa
  13. Levels: setosa versicolor virginica

  14. >
  15. > as.data.frame(df_as.list)
  16.    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  17. 1           5.1         3.5          1.4         0.2  setosa
  18. 2           4.9         3.0          1.4         0.2  setosa
  19. 3           4.7         3.2          1.3         0.2  setosa
  20. 4           4.6         3.1          1.5         0.2  setosa
  21. 5           5.0         3.6          1.4         0.2  setosa
  22. 6           5.4         3.9          1.7         0.4  setosa
  23. 7           4.6         3.4          1.4         0.3  setosa
  24. 8           5.0         3.4          1.5         0.2  setosa
  25. 9           4.4         2.9          1.4         0.2  setosa
  26. 10          4.9         3.1          1.5         0.1  setosa
复制代码
三、两层list将内层相同结构的数据合并为data.frame(解答开头的问题)
    1. > df_list <- list(
    2. +   x = list(
    3. +     a = iris[1:3,],
    4. +     b = iris[6:8,],
    5. +     c = iris[11:13,]
    6. +   )
    7. + )
    8. > df_list
    9. $x
    10. $x$a
    11.   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    12. 1          5.1         3.5          1.4         0.2  setosa
    13. 2          4.9         3.0          1.4         0.2  setosa
    14. 3          4.7         3.2          1.3         0.2  setosa

    15. $x$b
    16.   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    17. 6          5.4         3.9          1.7         0.4  setosa
    18. 7          4.6         3.4          1.4         0.3  setosa
    19. 8          5.0         3.4          1.5         0.2  setosa

    20. $x$c
    21.    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
    22. 11          5.4         3.7          1.5         0.2  setosa
    23. 12          4.8         3.4          1.6         0.2  setosa
    24. 13          4.8         3.0          1.4         0.1  setosa
    复制代码

方法1:data.table::rbindlist()

第二层list的名称直接替代了内层数据框data.frame的行名rownames,并实现数据框的行合并。

缺点:如果内层数据框的行名是需要的变量,数据会被覆盖

  1. > data.table::rbindlist(df_list$x)
  2.    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  3. 1:          5.1         3.5          1.4         0.2  setosa
  4. 2:          4.9         3.0          1.4         0.2  setosa
  5. 3:          4.7         3.2          1.3         0.2  setosa
  6. 4:          5.4         3.9          1.7         0.4  setosa
  7. 5:          4.6         3.4          1.4         0.3  setosa
  8. 6:          5.0         3.4          1.5         0.2  setosa
  9. 7:          5.4         3.7          1.5         0.2  setosa
  10. 8:          4.8         3.4          1.6         0.2  setosa
  11. 9:          4.8         3.0          1.4         0.1  setosa
  12. > data.table::rbindlist(df_list$x,use.names=TRUE, fill=TRUE, idcol="fenzu")
  13.    fenzu Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  14. 1:     a          5.1         3.5          1.4         0.2  setosa
  15. 2:     a          4.9         3.0          1.4         0.2  setosa
  16. 3:     a          4.7         3.2          1.3         0.2  setosa
  17. 4:     b          5.4         3.9          1.7         0.4  setosa
  18. 5:     b          4.6         3.4          1.4         0.3  setosa
  19. 6:     b          5.0         3.4          1.5         0.2  setosa
  20. 7:     c          5.4         3.7          1.5         0.2  setosa
  21. 8:     c          4.8         3.4          1.6         0.2  setosa
  22. 9:     c          4.8         3.0          1.4         0.1  setosa
复制代码
1.png
方法2:do.call与tibble::rownames_to_column与 tidyr::separate并用
  1. > df
  2.      Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  3. a.1           5.1         3.5          1.4         0.2  setosa
  4. a.2           4.9         3.0          1.4         0.2  setosa
  5. a.3           4.7         3.2          1.3         0.2  setosa
  6. b.6           5.4         3.9          1.7         0.4  setosa
  7. b.7           4.6         3.4          1.4         0.3  setosa
  8. b.8           5.0         3.4          1.5         0.2  setosa
  9. c.11          5.4         3.7          1.5         0.2  setosa
  10. c.12          4.8         3.4          1.6         0.2  setosa
  11. c.13          4.8         3.0          1.4         0.1  setosa
  12. >
  13. > df1 <- tibble::rownames_to_column(df,"data_code_market")
  14. > df1
  15.   data_code_market Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  16. 1              a.1          5.1         3.5          1.4         0.2  setosa
  17. 2              a.2          4.9         3.0          1.4         0.2  setosa
  18. 3              a.3          4.7         3.2          1.3         0.2  setosa
  19. 4              b.6          5.4         3.9          1.7         0.4  setosa
  20. 5              b.7          4.6         3.4          1.4         0.3  setosa
  21. 6              b.8          5.0         3.4          1.5         0.2  setosa
  22. 7             c.11          5.4         3.7          1.5         0.2  setosa
  23. 8             c.12          4.8         3.4          1.6         0.2  setosa
  24. 9             c.13          4.8         3.0          1.4         0.1  setosa
  25. >
  26. > # stringr::str_split(rownames(df),"[.]",simplify = TRUE)
  27. > df2 <- tidyr::separate(df1,data_code_market,into = c("fenzu","code"),sep = "[.]")
  28. > df2
  29.   fenzu code Sepal.Length Sepal.Width Petal.Length Petal.Width Species
  30. 1     a    1          5.1         3.5          1.4         0.2  setosa
  31. 2     a    2          4.9         3.0          1.4         0.2  setosa
  32. 3     a    3          4.7         3.2          1.3         0.2  setosa
  33. 4     b    6          5.4         3.9          1.7         0.4  setosa
  34. 5     b    7          4.6         3.4          1.4         0.3  setosa
  35. 6     b    8          5.0         3.4          1.5         0.2  setosa
  36. 7     c   11          5.4         3.7          1.5         0.2  setosa
  37. 8     c   12          4.8         3.4          1.6         0.2  setosa
  38. 9     c   13          4.8         3.0          1.4         0.1  setosa
复制代码

欢迎咨询,微信ahalara


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Frame Fram list Data FRA

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 04:08