Machine Learning | Shi Zhuolin's Blog

中文分词词性和序列标注之BI-LSTM-CRF-2-代码试验

使用tensorflow实现简易bi-lstm-crf序列标注（分词应用）。并使用pku语料训练和评估。

双向LSTM结合CRF, 用LSTM替代之前CRF模型的特征函数，实现可迁移的，更灵活和非线性的序列标注。

CRF 条件随机场分词和序列标注效果测试.和代码试验. 使用C/C++/Python混合实现，高性能需求部分由C/C++ ublas openmp实现，文本处理用python实现。

方法类似最大墒参数优化，但这里实际执行时特征函数需分两部分更新，且CRF是全局归一，而非MEMM那样局部归一。

使用维特比算法解决序列标注第二个问题，查找给定x序时具有最大概率的y序列。

线性链条件随机场的向前向后算法，计算给定输出序列概率

线性链条件随机场，参数化形式（势函数）,内积和矩阵表现形式。

无向图，子图，团，最大团，无向图因子分解.

使用BFGS/LBFGS算法优化MEMM模型并得到pku评分.

改进的迭代尺度优化算法的思路,通过给现有参数增加最大下界的增量参数以逐步迭代提高模型似然的方式优化模型参数。