LDA分析中,分析来确定主题数量时,perplexity随着主题数目增大持续下将,该怎么办?理论上讲,应该选择困惑度最小的那个主题数模,我只做了5到60个主题的分析,由于数据量太大,花了43个小时。我可以继续计算60到200个主题的perplexity,但是即便是到了100个主题时,perplexity开始上升,但是100个主题显然太多了,与实际情况不相符。那么我目前这个情况,该如何选择如题数目呢?
|
楼主: aaasssdddwww
|
13679
3
[问答] LDA主题模型中关于困惑度perplexity的问题 |
|
初中生 47%
-
|
| ||
|
|
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


