清华大学中文分词演示系统(Thu-Cws v1.0)
2011-01-22

作者:滕少华 谢丽星 孙茂松。
简介:本系统采用C++语言编写,支持跨平台的应用。清华大学中文分词演示系统(Thu-Cws v1.0)采用现今流行的条件随机场方法,结合预先给定的已切分好的训练集,进而训练出高效准确的分词模型,再利用该分类模型对测试样本进行切分,最后使 用一系列后处理算法对中文分词结果进行修正,完成整个分词过程。

演示地址