楼主: ReneeBK
1800 0

[Scala Study]K-Means Clustering using Scala [推广有奖]

  • 1关注
  • 62粉丝

VIP

已卖:4897份资源

学术权威

14%

还不是VIP/贵宾

-

TA的文库  其他...

R资源总汇

Panel Data Analysis

Experimental Design

威望
1
论坛币
49635 个
通用积分
55.6937
学术水平
370 点
热心指数
273 点
信用等级
335 点
经验
57805 点
帖子
4005
精华
21
在线时间
582 小时
注册时间
2005-5-8
最后登录
2023-11-26

楼主
ReneeBK 发表于 2015-11-16 00:33:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. package org.apache.spark.examples.ml
  2. import org.apache.spark.{SparkContext, SparkConf}
  3. import org.apache.spark.mllib.linalg.{VectorUDT, Vectors}
  4. import org.apache.spark.ml.clustering.KMeans
  5. import org.apache.spark.sql.{Row, SQLContext}
  6. import org.apache.spark.sql.types.{StructField, StructType}


  7. /**
  8. * An example demonstrating a k-means clustering.
  9. * Run with
  10. * {{{
  11. * bin/run-example ml.KMeansExample <file> <k>
  12. * }}}
  13. */
  14. object KMeansExample {

  15.   final val FEATURES_COL = "features"

  16.   def main(args: Array[String]): Unit = {
  17.     if (args.length != 2) {
  18.       // scalastyle:off println
  19.       System.err.println("Usage: ml.KMeansExample <file> <k>")
  20.       // scalastyle:on println
  21.       System.exit(1)
  22.     }
  23.     val input = args(0)
  24.     val k = args(1).toInt

  25.     // Creates a Spark context and a SQL context
  26.     val conf = new SparkConf().setAppName(s"${this.getClass.getSimpleName}")
  27.     val sc = new SparkContext(conf)
  28.     val sqlContext = new SQLContext(sc)

  29.     // Loads data
  30.     val rowRDD = sc.textFile(input).filter(_.nonEmpty)
  31.       .map(_.split(" ").map(_.toDouble)).map(Vectors.dense).map(Row(_))
  32.     val schema = StructType(Array(StructField(FEATURES_COL, new VectorUDT, false)))
  33.     val dataset = sqlContext.createDataFrame(rowRDD, schema)

  34.     // Trains a k-means model
  35.     val kmeans = new KMeans()
  36.       .setK(k)
  37.       .setFeaturesCol(FEATURES_COL)
  38.     val model = kmeans.fit(dataset)

  39.     // Shows the result
  40.     // scalastyle:off println
  41.     println("Final Centers: ")
  42.     model.clusterCenters.foreach(println)
  43.     // scalastyle:on println

  44.     sc.stop()
  45.   }
  46. }
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Clustering Cluster k-means SCALA study features example package import

本帖被以下文库推荐

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 00:11