求条件极值就可以证明了(求偏导数,条件是:所有的概率之和为1)
结论:均匀分布的时候,熵最大。
有两个变量:x,y。它们不是独立的。已知y,x的不确定度又是多少呢?
关于某个特征(x,y)的样本--特征所描述的语法现象在标准集合里的分布:
(xi,yi) pairs
yi是y的一个实例
xi是yi的上下文
(x1,y1) (x2,y2) (x3,y3)……
NLP与随机过程的关系(背景)
最大熵模型的介绍(熵的定义、最大熵模型)
最大熵模型的解决(非线性规划、对偶问题、最大似然率)
特征选取问题
应用实例
总结与启发