楼主: BestWorst_Tian
9380 19

[讨论交流] 马上开始搞文本挖掘,问问大家都用什么软件 [推广有奖]

  • 0关注
  • 3粉丝

已卖:959份资源

硕士生

26%

还不是VIP/贵宾

-

威望
0
论坛币
3644 个
通用积分
0.1200
学术水平
17 点
热心指数
17 点
信用等级
16 点
经验
1604 点
帖子
39
精华
1
在线时间
134 小时
注册时间
2014-9-28
最后登录
2024-5-15

楼主
BestWorst_Tian 发表于 2014-12-19 11:03:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  各位论坛的亲们,最近有个项目大体是要用文本挖掘技术来选股,本人本科研究生都是金融数学的,文本挖掘只是略有接触,不知道有没有人可以指导一下用什么软件的问题。
  目前纠结在这里,我对MATLAB用的比较熟悉,用matlab抓取一个网页什么的都没啥问题,用简单的正则表达式提取数据,如新浪财经的数据,这种都没问题,但是,我知道文本挖掘大部分人用的都是python,还有用R的,我从网上不太好找这些的比较,最多说的也就是速度问题,但是,我想问,究竟这个速度间隔多少,因为我要做的选股模型是一周甚至更久的,所以如果不是说要一两天才算的完我就没什么问题,我主要担心是不是matlab实现上会遇到很多问题,如果这样我就开始学一下python。。希望有大神能帮我做一个比较,,诚谢。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:文本挖掘 matlab实现 MATLAB python atlab 研究生 软件 本科 技术 数学

回帖推荐

faruto 发表于3楼  查看完整内容

舆情这块 核心是 自己团队的那张 正负面 语义库(表)的建立 数据这块挖来挖去,就那几个网站 新浪微博、微信、股吧、和讯 、雪球等。 除非你们公司 和 百度 、新浪 或者其他 互联网巨头 等有 深入合作(像广发基金、南方基金那样),能拿到 比其他人更多 、更全面的数据,否则大家能挖到的数据差不多。 差别就在分词的处理(分词也都有现成的包) 和 那张 正负面 语义库(表)【这张表每个团队都有自己的,不会share,是核心 ...
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
fantuanxiaot + 5 + 1 + 1 + 1 加油 哥们!!!!

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
faruto 发表于 2014-12-19 14:32:47
matlab r python 都差不多。

效率方面哪个软件你用精了、用通了。都不会差太多。

我有朋友

一个用matlab做文本挖掘 数据库用的是MySQL,构建 舆情策略

还有用python做得文本挖掘数据库用的是MS SQL,构建 舆情策略

条条大陆通罗马。

担心 matlab的速度啥的,我就懒得吐槽了。
已有 1 人评分论坛币 收起 理由
fantuanxiaot + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

藤椅
faruto 发表于 2014-12-19 14:38:53
舆情这块 核心是 自己团队的那张 正负面 语义库(表)的建立

数据这块挖来挖去,就那几个网站 新浪微博、微信、股吧、和讯 、雪球等。

除非你们公司 和 百度 、新浪 或者其他 互联网巨头 等有 深入合作(像广发基金、南方基金那样),能拿到 比其他人更多 、更全面的数据,否则大家能挖到的数据差不多。 差别就在分词的处理(分词也都有现成的包) 和 那张 正负面 语义库(表)【这张表每个团队都有自己的,不会share,是核心】。
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
见路不走 + 5 + 5 精彩帖子
fantuanxiaot + 5 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 5  论坛币 + 10  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

板凳
BestWorst_Tian 发表于 2014-12-19 15:15:22
faruto 发表于 2014-12-19 14:38
舆情这块 核心是 自己团队的那张 正负面 语义库(表)的建立

数据这块挖来挖去,就那几个网站 新浪微博、 ...
恩,有道理,我先用matlab尝试一下,估计是我掌握的还不是太精,这一块接触太少了。。楼上就是传说中叫做李洋的大神吗??真是万分感谢
已有 1 人评分经验 论坛币 收起 理由
fantuanxiaot + 5 + 10 精彩帖子

总评分: 经验 + 5  论坛币 + 10   查看全部评分

报纸
fantuanxiaot 发表于 2014-12-19 16:34:03
BestWorst_Tian 发表于 2014-12-19 15:15
恩,有道理,我先用matlab尝试一下,估计是我掌握的还不是太精,这一块接触太少了。。楼上就是传说中叫做 ...
正是大神

地板
fantuanxiaot 发表于 2014-12-19 16:34:46
我本科和研究生都是金融工程,兄长应该在实习吧

7
faruto 发表于 2014-12-19 16:37:22
BestWorst_Tian 发表于 2014-12-19 15:15
恩,有道理,我先用matlab尝试一下,估计是我掌握的还不是太精,这一块接触太少了。。楼上就是传说中叫做 ...
不是 大神,都是量化 菜鸟。互相交流学习哈。

已有 1 人评分经验 论坛币 收起 理由
fantuanxiaot + 5 + 5 精彩帖子

总评分: 经验 + 5  论坛币 + 5   查看全部评分

8
BestWorst_Tian 发表于 2014-12-19 20:00:52
fantuanxiaot 发表于 2014-12-19 16:34
我本科和研究生都是金融工程,兄长应该在实习吧
对啊,刚刚毕业,感觉学校学的和真正要的不太一样,现在正在实习,兄弟你已经进入这一块很久了吧
已有 1 人评分经验 论坛币 收起 理由
fantuanxiaot + 5 + 5 精彩帖子

总评分: 经验 + 5  论坛币 + 5   查看全部评分

9
BestWorst_Tian 发表于 2014-12-19 20:03:08
faruto 发表于 2014-12-19 16:37
不是 大神,都是量化 菜鸟。互相交流学习哈。
果然,,再膜拜一下,当然当然,特别渴望有机会和实力能和 faruto兄交流。。
已有 1 人评分论坛币 收起 理由
fantuanxiaot + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

10
BestWorst_Tian 发表于 2014-12-19 20:03:11
faruto 发表于 2014-12-19 16:37
不是 大神,都是量化 菜鸟。互相交流学习哈。
果然,,再膜拜一下,当然当然,特别渴望有机会和实力能和 faruto兄交流。。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2026-1-3 19:42