所謂"非監督式",即是針對一堆未知標籤的數據集做分類,結果只會告知哪些數據屬於同一群體。換句話說,只有一堆輸入數據,但無定義輸出變量,常應用於對既有數據的內在分類的探討,如對顧客購買行為的分類。
k-means聚類算法的原理,係利用數據與和質心的歐式距離為判斷依據,不斷迭代直到預設收斂值,最終取得分類結果。其中輸入變量如下:
1.預計劃分為多少群體,即k值。
2.給訂初始質心值。
3.預設收斂值,一般可用新質心和舊質心的距離小於多少來定義。
在企業營運中,供應商的優劣對公司營運有著舉足輕重的角色...
完整文章,請參考我的博客,如下:
https://blog.csdn.net/weixin_42008031/article/details/104204307