- 阅读权限
- 255
- 威望
- 1 级
- 论坛币
- 49635 个
- 通用积分
- 55.6937
- 学术水平
- 370 点
- 热心指数
- 273 点
- 信用等级
- 335 点
- 经验
- 57805 点
- 帖子
- 4005
- 精华
- 21
- 在线时间
- 582 小时
- 注册时间
- 2005-5-8
- 最后登录
- 2023-11-26
已卖:4897份资源
学术权威
还不是VIP/贵宾
TA的文库 其他... R资源总汇
Panel Data Analysis
Experimental Design
- 威望
- 1 级
- 论坛币
 - 49635 个
- 通用积分
- 55.6937
- 学术水平
- 370 点
- 热心指数
- 273 点
- 信用等级
- 335 点
- 经验
- 57805 点
- 帖子
- 4005
- 精华
- 21
- 在线时间
- 582 小时
- 注册时间
- 2005-5-8
- 最后登录
- 2023-11-26
 | 开心 2017-10-21 10:25:33 |
|---|
签到天数: 1 天 连续签到: 1 天 [LV.1]初来乍到
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
- """
- NaiveBayes Example.
- """
- from __future__ import print_function
- from pyspark import SparkContext
- # $example on$
- from pyspark.mllib.classification import NaiveBayes, NaiveBayesModel
- from pyspark.mllib.linalg import Vectors
- from pyspark.mllib.regression import LabeledPoint
- def parseLine(line):
- parts = line.split(',')
- label = float(parts[0])
- features = Vectors.dense([float(x) for x in parts[1].split(' ')])
- return LabeledPoint(label, features)
- # $example off$
- if __name__ == "__main__":
- sc = SparkContext(appName="PythonNaiveBayesExample")
- # $example on$
- data = sc.textFile('data/mllib/sample_naive_bayes_data.txt').map(parseLine)
- # Split data aproximately into training (60%) and test (40%)
- training, test = data.randomSplit([0.6, 0.4], seed=0)
- # Train a naive Bayes model.
- model = NaiveBayes.train(training, 1.0)
- # Make prediction and test accuracy.
- predictionAndLabel = test.map(lambda p: (model.predict(p.features), p.label))
- accuracy = 1.0 * predictionAndLabel.filter(lambda (x, v): x == v).count() / test.count()
- # Save and load model
- model.save(sc, "target/tmp/myNaiveBayesModel")
- sameModel = NaiveBayesModel.load(sc, "target/tmp/myNaiveBayesModel")
- # $example off$
复制代码
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|