楼主: EchoEstelle
1075 0

[数据挖掘理论与案例] 类的五种定义和三种特征 [推广有奖]

  • 0关注
  • 31粉丝

已卖:174份资源

教授

56%

还不是VIP/贵宾

-

威望
0
论坛币
6772 个
通用积分
1.2139
学术水平
220 点
热心指数
149 点
信用等级
90 点
经验
22842 点
帖子
498
精华
7
在线时间
839 小时
注册时间
2010-3-10
最后登录
2016-7-20

楼主
EchoEstelle 发表于 2015-2-19 18:11:41 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
定义一:设阈值T是给定的正数,如果集合G中任意两个元素的距离d_ij都满足:d_ij<T(i,j \in G),则称G对于阈值T组成一个类。定义二:设阈值T是给定的正数,如果集合G中每个i \in G都满足下面条件,其中n是集合元素个数,则称G对于阈值T组成一个类:
\[\frac{1}{n-1}\sum_{j \in G}d_ij<=T\]
定义三:设T和H(H>T)是两个给定的正数,如果集合G中的两两元素距离的平均满足下条件,则真G对于阈值T,H形成一个类:
\[\frac{1}{n(n-1)}\sum_{i \in G}\sum_{j \in G}d_ij \leq T,d_ij \leq H\]
定义四:设T是给定正数,将集合G任意一i\inG,一定存在j inG,使得两元素的距离d_ij满足下面条件,则称G对于阈值T形成分类:
\[d_{ij} \leq T\]
定义五:设阈值T是给定的正数,将集合G任意分为两类:G1和G2,这两类之间的距离D(G1,G2)满足:D(G1,G2)<T,则称G对于阈值T组成一个类。

设类G包含n个样本,其中X_(t)为m维总体的样本,通常用下面三种特征刻画类:


(1)均值或者质心:
\[{\bar{X}}_G=\frac{1}{n}\sum_{t=1}^{n}X_{(t)}\]
(2)样本离差阵A_G级样本协方差阵S_G:
\[A_G=\sum{t=1}^{n}(X_{(t)}-{\bar{X}}_G)(X_{(t)}-{\bar{X}}_G)',\,S_G=\frac{1}{n-1}A_G\]
(3)类的直径:用D_G表示类G的直径,常用的直径有:
\[D_G=\sum_{t=1}^{n}(X_{(t)}-{\bar{X}}_G)'(X_{(t)}-{\bar{X}}_G)=tr(A_G),\,D_G=\max_{i,j \in G}d_ij\]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:元素

我非我见我释我是我非我

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-17 22:48