人大经济论坛 › 论坛 › 数据科学与人工智能 › 大数据分析 › Hadoop论坛 › 运行pyspark的logistic回归报错

发帖

楼主: 孙悟充

2977 3

[分布式系统架构] 运行pyspark的logistic回归报错 [推广有奖]

0关注
1粉丝

大专生

76%

还不是VIP/贵宾

威望: 0 级
论坛币: 88 个
通用积分: 4.1091
学术水平: 0 点
热心指数: 1 点
信用等级: 0 点
经验: 701 点
帖子: 44
精华: 0
在线时间: 42 小时
注册时间: 2018-3-28
最后登录: 2019-5-8

楼主

孙悟充

发表于 2018-12-28 14:06:30 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

data = RandomRDDs.normalVectorRDD(sc, 100000, 10, seed=2)
def tologisticregressiondata(x):
return LabeledPoint(rd.randint(0,1), x)
dataforlogisticregression = data.map(tologisticregressiondata)
cdata = dataforlogisticregression.randomSplit([0.8, 0.2])
ctrain = cdata[0]
ctest = cdata[1]
cmodel = LogisticRegressionWithLBFGS.train(ctrain)

复制代码

-------------------------------------------------------------------------------------------------------------------------------------------
18/12/28 13:57:29 WARN HiveConf: HiveConf of name hive.server2.enable.impersonation does not exist
18/12/28 13:57:29 WARN metastore: Failed to connect to the MetaStore Server...
18/12/28 13:57:30 WARN metastore: Failed to connect to the MetaStore Server...
18/12/28 13:57:31 WARN metastore: Failed to connect to the MetaStore Server...
18/12/28 13:57:32 WARN Hive: Failed to access metastore. This class should not accessed in runtime.
org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate o rg.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient
请问为什么会这样呢，其他方法，比如线性回归，SVM，随机森林等等都没有问题，只有logistic回归会报这个错误

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：spark pyspark logistic hive mllib

相关帖子

已有 1 人评分	热心指数	收起理由
zhdefei	+ 1	热心帮助其他会员

总评分: 热心指数 + 1 查看全部评分

沙发

孙悟充

发表于 2018-12-28 14:38:19

尝试用随机梯度就没有问题

藤椅

孙悟充

发表于 2018-12-28 15:02:43

>>> multi_class_data = [
...    LabeledPoint(0.0, [0.0, 1.0, 0.0]),
...    LabeledPoint(1.0, [1.0, 0.0, 0.0]),
...    LabeledPoint(2.0, [0.0, 0.0, 1.0])
... ]
>>> data = sc.parallelize(multi_class_data)
>>> mcm = LogisticRegressionWithLBFGS.train(data, iterations=10, numClasses=3)

=================================

这里会报这个错
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/lib/spark-current/python/pyspark/mllib/classification.py", line 398, in train
return _regression_train_wrapper(train, LogisticRegressionModel, data, initialWeights)
  File "/usr/lib/spark-current/python/pyspark/mllib/regression.py", line 216, in _regression_train_wrapper
return modelClass(weights, intercept, numFeatures, numClasses)
  File "/usr/lib/spark-current/python/pyspark/mllib/classification.py", line 176, in __init__
self._dataWithBiasSize)
TypeError: 'float' object cannot be interpreted as an integer

板凳

admin_kefu 发表于 2019-1-22 17:26:15

您好，如果您的求助没有解决，请到项目交易发布需求，会有更快更专业的用户帮助您 https://bbs.pinggu.org/prj/

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[分布式系统架构] 运行pyspark的logistic回归报错 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级信用勋章

中级信用勋章

初级热心勋章

初级学术勋章

中级学术勋章

中级热心勋章

本版微信群

[分布式系统架构] 运行pyspark的logistic回归报错 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

初级信用勋章

中级信用勋章

初级热心勋章

初级学术勋章

中级学术勋章

中级热心勋章

本版微信群

扫码加我拉你入群