楼主: erilee
8073 3

[问答] 关于kindex的疑惑 [推广有奖]

  • 3关注
  • 0粉丝

高中生

42%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1100 点
帖子
28
精华
0
在线时间
22 小时
注册时间
2008-7-25
最后登录
2016-6-1

楼主
erilee 发表于 2014-4-28 21:31:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
用kindex做文本匹配,如果kindex的第二个参数是一个向量,在做表连接的时候,是否会出现查不出文本所在位置的情况?

proc sql;
create table x as
  select * from
   table1 t1left join talbe2 t2
   on kindex(t1.var1, t2.var3) ne 0;
quit;
还会提示,“该查询涉及多个笛卡尔积。。。。”
用1000000行和1000行匹配效率极低。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:kindex Index kind IND left join

沙发
playmore 发表于 2014-4-29 08:58:04
你是在sql语句里用的kindex
出现的位置也是在on子句里
在这里是用t1表每个观测的var1变量和t2表每个观测的var3变量匹配
不存在第二个参数是向量的问题

又因为你这是一个观测一个观测的匹配(on里面有其他非sql的函数表达式)
所以只能先做一个笛卡尔积,这时会非常慢,数据量大的话基本不可行
我也不知道有什么其他好的办法,这种大规模的文本挖掘,估计用sql是不行了

playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

藤椅
erilee 发表于 2014-5-3 21:18:31
playmore 发表于 2014-4-29 08:58
你是在sql语句里用的kindex
出现的位置也是在on子句里
在这里是用t1表每个观测的var1变量和t2表每个观测的 ...
说的有道理,已经采取了更笨的办法。在data步里做

板凳
soporaeternus 发表于 2014-5-4 15:53:04
playmore 发表于 2014-4-29 08:58
你是在sql语句里用的kindex
出现的位置也是在on子句里
在这里是用t1表每个观测的var1变量和t2表每个观测的 ...
这个本质和你之前那个汉字转拼音是等价的
以我了解hash和format是效率最好的两种
Let them be hard, but never unjust

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 09:49