机器学习应用几个点:
a, 预测
训练模型,模型给的结果负无穷到正无穷
算法:
多元线性回归
神经网络
b, 分类
训练模型,模型给的结果是其中某一个类别号
算法:
贝叶斯分类,使用场景,文本分类
朴素贝叶斯,Naive Bayes,其中以相互独立为假设去计算
拉普拉斯估计,是把取0变成1,当然为了公平,每个特征都加一
词袋模型,一篇文章打乱等价于一堆词
c, 聚类
d, 推荐
算法:
基于物品的协同过滤
e, 关联规则
支持度 置信度
算法:
Apriori
f, 降维
1,机器学习是什么?
数据-->训练,带入算法计算-->模型
2,如何可以使得模型更好?
a,增加数据
b,调整算法
3,算法是公式!
4,数据是公式里面的X和Y
5,模型是什么?
参数!计算机计算模型的过程,说白了就是求解方程组的过程!
求解模型,就是要找到最优解,误差最小的时候就是最优解!
6,什么是最好的模型?
尽可能的让误差最小!
误差定义称为损失函数!
7,多元线性回归
-- 预测
y = w1*x1 + w2*x2 + wn*xn + w0
正无穷到负无穷
线性,Xi,Y变化符合一条直线
回归,回归到平均值
案例:保险的案例
a, age进行了平方?
是让数据更加适应算法,更加符合线性变化
b, bmi30*smoker?
是在你更了解业务数据的情况下
8,神经网络 -- 预测
输入层
输出层
隐藏层,可以有多个隐藏层,隐含的推理出来的开始特征的可能性
已有的数据-->算法训练-->生成模型
案例:水泥的强度
a, 增加了隐藏层的隐藏节点的个数
b, 为了避免过拟合,测试集来测模型的效果,多数的数据用于训练,少数的数据用于测试


雷达卡




京公网安备 11010802022788号







