人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 学道会 › 【学习笔记】import numpy as np import pandas as pd f ...

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

发帖

楼主: 7112_1566899082

2377 0

[学习笔记] 【学习笔记】import numpy as np import pandas as pd from sklearn.datasets ... [推广有奖]

0关注
0粉丝

高中生

37%

还不是VIP/贵宾

威望: 0 级
论坛币: 0 个
通用积分: 9.3699
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 253 点
帖子: 21
精华: 0
在线时间: 10 小时
注册时间: 2019-8-27
最后登录: 2023-12-7

楼主

7112_1566899082 发表于 2019-12-3 18:15:12 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

import numpy as np
import pandas as pd
from sklearn.datasets import fetch_california_housing as fch
from clean2 import *

housevalue = fch()
data = pd.DataFrame(housevalue.data, columns = housevalue.feature_names)
data[\'Price\'] = housevalue.target

m = manipulate(data)
std_data = m.data
train_data, test_data = m.train_data, m.test_data

class LRegression:
def __init__(self, intercept = True):
      self.intercept = intercept

def fit(self, data, lam = 0):
      X = data.iloc[:, :-1].values
      Y = data.iloc[:, -1].values
      SST = np.var(Y) * len(Y)

      if self.intercept:
         ones = np.array([1] * data.shape[0])
         X = np.column_stack((ones, X))
      X = np.mat(X)
      Y = np.mat(Y).T

      XTX = X.T * X + np.eye(X.shape[1]) * lam
      if np.linalg.det(XTX) == 0:
         print(\'X is linear dependent, exiting now\')
         return
      theta = XTX.I * X.T * Y
      Y_pred = X * theta
      error = Y - Y_pred
      SSE = np.power(Y - Y_pred, 2).sum()
      coef_ = np.ravel(theta)
      self.coef_ = theta
      return SSE, coef_

def predict(self, data):
      X = np.mat(data.iloc[:, :-1].values)
      Y = np.mat(data.iloc[:, -1].values)

      X = np.column_stack((np.ones(X.shape[0]), X))

      Y_pred = X * self.coef_
      SSE_pred = np.power(Y - np.ravel(Y_pred), 2).sum()
      return Y_pred, SSE_pred

def solution(p, lam):
      if p < -lam:
         return p + lam
      elif p > lam:
         return p - lam
      else:
         return 0

def lasso_regression(data, lam = 0.1, num_inter = 1000):
X = data.iloc[:, :-1].values
Y = data.iloc[:, -1].values
X = np.column_stack((np.ones(X.shape[0]), X))
col_sum = np.power(np.power(X, 2).sum(axis = 0), 0.5)
X = X / col_sum
theta = np.ones((X.shape[1]))

for _ in range(num_inter):
      for j in range(X.shape[1]):
         X_j = X[:, j]
         Y_pred = np.mat(X) * np.mat(theta).T
         p = np.mat(X_j) * (np.mat(Y).T - \\
                           Y_pred + \\
                           np.ravel(theta[j])[0] * np.mat(X_j).T)
         p = np.ravel(p)[0]
         theta[j] = solution(p, lam)
return theta/col_sum

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：datasets dataset import pandas Learn

[学习笔记] 【学习笔记】import numpy as np import pandas as pd from sklearn.datasets ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

[学习笔记] 【学习笔记】import numpy as np import pandas as pd from sklearn.datasets ... [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群