楼主: peylinn8
539 1

[学习笔记] 【学习笔记】2020/01/02 《百面机器学习-算法工程师带你去面试》读书笔记 《N ... [推广有奖]

  • 0关注
  • 6粉丝

副教授

4%

还不是VIP/贵宾

-

威望
0
论坛币
3852 个
通用积分
378.7263
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2958 点
帖子
532
精华
0
在线时间
3 小时
注册时间
2017-3-31
最后登录
2023-10-31

楼主
peylinn8 发表于 2020-1-2 13:29:37 来自手机 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
2020/01/02
《百面机器学习-算法工程师带你去面试》读书笔记
《No.2: p6~p21》第一章 特征工程

Q3 高维特征组合的处理
1        什么是组合特征: 将一阶离散特征两两组合,构成高阶组合特征。
2        如何处理高维特征组合
   处理ID类型的特征时,为了避免参数规模过大,先将参数降维后再进行组合处理。类似推荐系统矩阵分解的思路。

Q4 如何有效地找到特征组合
   可透过”决策树”来找出特征组合
1.        决策树展示出的结果,每一条根节点到叶节点的路径可以看成一种特征组合。
2.        可用梯度提升决策树来找出特征组合,此方法就是在之前构建的决策树的残差上构建下一科决策树。

Q5 有哪些文本模型,各有什么优缺点?
1        有哪些文本模型?
1.1        词袋模型(Bag of Words)
1.1.1        将每篇文章看成一袋子词,不看每个词出现的顺序。
1.1.2        N-gram模型: 将连续出现的n个词,组成的词组作为一个单独的特征放到向量表示中;会进行词干抽取(Word Stemming),将不同词但同义词,归在一起处理。
1.2        TF-IDF(Term Frequency-Inverse Document Frequency):衡量”词”在原文章中的重要程度。TF
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 学习笔记 读书笔记 习笔记 工程师

沙发
jessie68us 发表于 2020-1-4 00:49:58 来自手机 |只看作者 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 01:14