楼主: 资料狂人
7914 26

[李御玺] 铭传大学计算机工程学系李御玺(数据仓库、数据挖掘、文本挖掘)11月3日在线访谈  关闭 [推广有奖]

11
profleeys 发表于 2014-11-3 13:58:15
资料狂人 发表于 2014-11-2 10:04
坛友゛为つaiり=んU:
你好,老师i,我想问一下文本挖掘的热点有哪些,NLP的瓶颈在哪里,对于文本挖掘和数 ...
您好,
文本挖掘目前商業上熱點為網路的輿情分析! NLP(自然語言處理)的瓶頸若是要分析中文,
則首先會遇到斷詞/分詞的問題, 其次是詞性標註及語法剖析的問題!
若是輿情分析的話則還有情緒分析的問題!
文本挖掘主要的分析數據為文本數據, 數據挖掘主要是數據庫中的結構化數據!
方法上, 有共同之處, 例如文本也會做分類, 也會作聚類!
但文本的複雜度比數據庫的數據複雜許多!
機器學系的算法是比較難理解的, 但需用簡單且淺顯的方式來讓別人理解!
11/13~11/16的課程中, 應該可以有此體會!

12
profleeys 发表于 2014-11-3 14:03:01
您好,
數據挖掘在會計及審計上的應用, 我自己的經驗是在做詐欺偵測!
我的學生在台灣的審計部工作, 就是利用數據挖掘中的關聯規則
找出那些得標的廠商通常與那些廠商會同時來競標
以找出哪些廠商是得標廠商找來一起合作的!

13
profleeys 发表于 2014-11-3 14:06:14
您好,
數據挖掘在會計及審計上的應用, 我自己的經驗是在做詐欺偵測!
我的學生在台灣的審計部工作, 就是利用數據挖掘中的關聯規則
找出那些得標的廠商通常與那些廠商會同時來競標
以找出哪些廠商是得標廠商找來一起合作的!

14
profleeys 发表于 2014-11-3 14:13:25
资料狂人 发表于 2014-11-2 10:04
坛友゛为つaiり=んU:
你好,老师i,我想问一下文本挖掘的热点有哪些,NLP的瓶颈在哪里,对于文本挖掘和数 ...
您好,
文本挖掘目前商業上熱點為網路的輿情分析! NLP(自然語言處理)的瓶頸若是要分析中文,
則首先會遇到斷詞/分詞的問題, 其次是詞性標註及語法剖析的問題!
若是輿情分析的話則還有情緒分析的問題!
文本挖掘主要的分析數據為文本數據, 數據挖掘主要是數據庫中的結構化數據!
方法上, 有共同之處, 例如文本也會做分類, 也會作聚類!
但文本的複雜度比數據庫的數據複雜許多!
機器學系的算法是比較難理解的, 但需用簡單且淺顯的方式來讓別人理解!
11/13~11/16的課程中, 應該可以有此體會!

15
profleeys 发表于 2014-11-3 14:14:01
shortsale 发表于 2014-11-3 07:38
李老师,您好!能否介绍数据挖掘在会计与审计方面的应用,谢谢。
您好,
數據挖掘在會計及審計上的應用, 我自己的經驗是在做詐欺偵測!
我的學生在台灣的審計部工作, 就是利用數據挖掘中的關聯規則
找出那些得標的廠商通常與那些廠商會同時來競標
以找出哪些廠商是得標廠商找來一起合作的!

16
profleeys 发表于 2014-11-3 14:20:49
天心月映婷 发表于 2014-11-3 08:42
李老師您好!非常感謝您撥冗指點!請問在研究歷史中,如何能利用文本挖掘技術?比如說,收集了某段時間的相 ...
您好,
我的一個朋友有研究紅樓夢的文本挖掘!
經過文本分析, 他可以得出在紅樓夢中會出現哪些髮飾, 誰最常梳哪種頭?等等!
你的問題: 收集了某段時間的相關法規制度后,想找出其制度演變的規律,如何結合挖掘技術來研究呢?
是有點類似的問題, 但難度難得多! 通常, 會先嘗試利用文本挖掘來發展問答系統(例如, 中國最長的河流是?)
能答得出來後, 才有辦法進行你這方面問題的研究!

17
profleeys 发表于 2014-11-3 14:21:35
Oneday1 发表于 2014-11-3 09:04
李老师,你好!请问跨行业的数据,该如何进行分析?
您好,
您的問題太抽象, 可否再明確一些!

18
profleeys 发表于 2014-11-3 14:25:57
小粗腿or大粗腿 发表于 2014-11-3 09:51
李老师您好,自从大数据概念出现以来,一直被各行各业的人士吹捧,其吹捧的火热程度已经超过了大数据应用本 ...
您好, 大數據是未來的必然趨勢, 目前是有些過頭!
認為大數據可以解決所有的問題, 而且不會有錯!
但我認為大數據不會泡沫化, 而是會回歸正常化!
大數據可以解決一部分的問題, 且並不能保證絕對的精確!
但即便是如此, 就能為企業帶來極大的獲利!
我在11/13~11/16的課堂中會詳細舉例說明
要如何謹慎看待大數據!

19
profleeys 发表于 2014-11-3 14:29:24
青菜木 发表于 2014-11-3 10:00
李老师,您好,经常在网上看到BAT等大型企业通过大数据如何如何捞金等新闻,但对于小企业来说,我是很困惑, ...
您好,
其實分析是不分大企業及小企業,
重點在於要分析的題目為何? 是否能夠透過數據來解決?
數據是否能夠收集得到? 是否完整?
分析人員的素質是否足夠?等等

20
profleeys 发表于 2014-11-3 14:34:21
songasia 发表于 2014-11-3 12:22
李老师,您好,因为目前的数据分析与挖掘的研究方面基本都倾向于1.数据挖掘算法的研究和实现,2.数据挖掘在 ...
您好,
在學術研究中的熱點, 我覺得非常多! 例如, 如何在Hadoop的環境下來實現關聯規則的算法即是其一!
但我本身則更關注在數據挖掘實務的研究!
實務本身不見得是將現有模型套入實務的數據而已, 其實可研究的還是有很多!
課堂中, 我會介紹一些實務中可研究的許多議題並告訴大家如何能取得一些實務的數據來做研究!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 15:28