THUMT(THU Machine Translation System)由清华大学自然语言处理与社会人文计算实验室研制推出的机器翻译演示系统。THUMT主要采用统计机器翻译技术,具有以下特点:
* 数据驱动:不依赖于人类专家编纂规则,直接从双语数据中获取翻译知识。
* 语言无关:所采用的统计模型具有语言通用性,同时可以针对具体语言特性进行专门设计。
* 深层分析:用于语言句法结构实现词语顺序调整,相对传统方法提高了流利度。
目前系统支持汉译英和英译汉两个方向,主要适用于新闻领域的翻译。
研发:李鹏, 刘洋,孙茂松
Design and development:Peng Li, Yang Liu, Maosong Sun
演示/Demo: http://thumt.thunlp.org:9315/