楼主: JLOGAN
1050 4

[学习分享] 汉字数值化 [推广有奖]

  • 3关注
  • 0粉丝

硕士生

16%

还不是VIP/贵宾

-

威望
0
论坛币
24 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2830 点
帖子
87
精华
0
在线时间
97 小时
注册时间
2016-5-28
最后登录
2018-8-4

楼主
JLOGAN 发表于 2016-8-8 19:59:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位,想要进行相关分析以及分类聚类,但是属性是汉字,怎么数值化,向量化?求指教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相关分析 求指教 向量化 汉字

沙发
Baby-Zhao 发表于 2016-8-10 09:30:14
你数据内的汉字肯定是有一定的等级的,你将汉字按等级分别换成 0-n

藤椅
JLOGAN 发表于 2016-8-10 11:52:44
Baby-Zhao 发表于 2016-8-10 09:30
你数据内的汉字肯定是有一定的等级的,你将汉字按等级分别换成 0-n
请问怎么讲等级?你是说因子型吗?我想过每个词给一个属于自己的编码,就像二进制码那样,使得每个字词具有唯一吗,但是不知道怎么实现

板凳
Baby-Zhao 发表于 2016-8-10 14:32:32
R语言实战里有个例子,作者把经药物作用后呈现的结果"poor","improved","excellent",分别用 1,2,3表示的

报纸
JLOGAN 发表于 2016-8-10 15:02:33
Baby-Zhao 发表于 2016-8-10 14:32
R语言实战里有个例子,作者把经药物作用后呈现的结果"poor","improved","excellent",分别用 1,2,3表示的
谢谢!书上那是因子型,我的数据现在有很多,转为因子型量还是很大

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 15:51