您好,
文本挖掘目前商業上熱點為網路的輿情分析! NLP(自然語言處理)的瓶頸若是要分析中文,
則首先會遇到斷詞/分詞的問題, 其次是詞性標註及語法剖析的問題!
若是輿情分析的話則還有情緒分析的問題!
文本挖掘主要的分析數據為文本數據, 數據挖掘主要是數據庫中的結構化數據!
方法上, 有共同之處, 例如文本也會做分類, 也會作聚類!
但文本的複雜度比數據庫的數據複雜許多!
機器學系的算法是比較難理解的, 但需用簡單且淺顯的方式來讓別人理解!
11/13~11/16的課程中, 應該可以有此體會!


雷达卡
京公网安备 11010802022788号







