楼主: 9248_1572342225
1118 0

[学习笔记] 【学习笔记】from sklearn.ensemble import RandomForestRegressor from skle ... [推广有奖]

  • 0关注
  • 0粉丝

本科生

83%

还不是VIP/贵宾

-

威望
0
论坛币
40 个
通用积分
14.1000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
510 点
帖子
91
精华
0
在线时间
0 小时
注册时间
2019-10-29
最后登录
2020-1-12

楼主
9248_1572342225 发表于 2020-1-8 09:22:12 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import LabelEncoder

#给object型变量编码
encode=LabelEncoder()
table.uid=encode.fit_transform(table.uid)
table.roomid=encode.fit_transform(table.roomid)
X_missing_reg=table.copy()

#提取有缺失值字段的索引
sortindex = np.argsort(X_missing_reg.isnull().sum(axis=0))[::-1].values

for i in sortindex:
    #构建我们的新特征矩阵和新标签
    df = X_missing_reg
    fillc = df.iloc[:,i]
    df = df.iloc[:,df.columns != i]
   
    #在新特征矩阵中,对含有缺失值的列,进行0的填补
    df_0 =SimpleImputer(missing_values=np.nan,
                        strategy=\'constant\',fill_value=0).fit_transform(df)
   
    #找出我们的训练集和测试集
    Ytrain = fillc[fillc.notnull()]
    Ytest = fillc[fillc.isnull()]
    Xtrain = df_0[Ytrain.index,:]
    Xtest = df_0[Ytest.index,:]
   
    #用随机森林回归来填补缺失值
    rfc = RandomForestRegressor(n_estimators=100)
    rfc = rfc.fit(Xtrain, Ytrain)
    Ypredict = rfc.predict(Xtest)
   
    #将填补好的特征返回到我们的原始的特征矩阵中
    X_missing_reg.loc[X_missing_reg.iloc[:,i].isnull(),X_missing_reg.columns] = Ypredict

table=X_missing_reg.copy()
table.isnull().sum()
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:randomForest regress random import Forest

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-22 10:07