楼主: EchoEstelle
3164 3

[数据挖掘理论与案例] 数据挖掘建模的五个方向 [推广有奖]

  • 0关注
  • 31粉丝

已卖:174份资源

教授

56%

还不是VIP/贵宾

-

威望
0
论坛币
6772 个
通用积分
1.2139
学术水平
220 点
热心指数
149 点
信用等级
90 点
经验
22842 点
帖子
498
精华
7
在线时间
839 小时
注册时间
2010-3-10
最后登录
2016-7-20

楼主
EchoEstelle 发表于 2015-2-14 18:54:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
1.统计建模。统计模型的构建过程,统计模型就是可见数据所遵从的总体分布。可能犯的错误是将能从随机数据中抽取出来的显著特征作为挖掘出来的特征。能从随机数据中挖掘出来的显著特征有哪些?
2.机器学习。使用机器学习算法,机器学习擅长的场景是人们几乎对数据中寻找的目标几乎一无所知。当挖掘的目标能够更直接的描述时,机器学习算法并不成功。
3.建模的计算方法。将数据挖掘看成一个算法问题,数据模型仅仅就是复杂查询的答案。可以通过其生成所可能遵从的统计过程建模;对数据进行简洁的近似汇总描述;从数据中抽取最突出的特征来代替数据然后忽略其他内容。
4.数据汇总。PageRank是一种有趣的数据汇总形式;另一种重要的数据汇总形式是聚类,概括类别信息就形成了数据汇总的结果。
5.特征抽取。两种主要的特征抽取类型(1)频繁项集(2)相似项。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 机器学习算法 机器学习 统计模型 学习算法 计算方法 模型 统计 信息

我非我见我释我是我非我

沙发
olympic 发表于 2015-2-14 19:02:48
PageRank是啥

藤椅
EchoEstelle 发表于 2015-2-14 22:27:56
olympic 发表于 2015-2-14 19:02
PageRank是啥
PageRank是一个函数,它对web中的每个网页赋予一个值。Web可以想象成一个有向图,网页就是其中的节点,如果网页
p1到p2之间存在一条或多条链接,则p1到p2存在一条有向边。可以用web转移矩阵来描述随机冲浪者的下一步访问行动。
如果网页有n个,转移矩阵M是n行n列方阵。如果网页j有k条出链,那么对于每一个出边链向的网页i,矩阵第i行第j列的矩阵
元素m_ij的值为1/k,而其他网页i的m_ij=0.随机冲浪者位置的概率分布可以通过一个n维列向量表示,其中向量的第j个分量代
表冲浪者处于网页j的概率。该概率就是理想化的PageRank的值。

随机冲浪者初始的概率分布向量v_0;Web的转移矩阵M;
那么第一步后随机冲浪者的概率分布向量就是M *v_0;
第二步之后的随机冲浪者的概率分布向量就是M^2 * v_0;
因为:如果随机冲浪者位于i的概率是x_i,那么x_i=sum_{j}m_ij*v_j

如果(1)web图是强连通的,即从任意一点可以到达其他节点;(2)图不存在终止点,即不存在出链的节点
经过若干步随机冲浪者的分布将达到极限分布v,满足v=M*v。

PageRank的直观意义就是冲浪者处于某个页面的概率越大,该页面也就越重要。一般左乘50~75次M,v就收敛。


我非我见我释我是我非我

板凳
olympic 发表于 2015-2-14 22:47:59
EchoEstelle 发表于 2015-2-14 22:27
PageRank是一个函数,它对web中的每个网页赋予一个值。Web可以想象成一个有向图,网页就是其中的节点,如 ...
谢谢讲解
要是百度用pageRank的话立马就出局了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 07:28