研究队伍

Demo

研究项目

  • 作者:管理员
  • 分类:Demo
  • 点击数:33984
纵向项目
  1. 国家自然科学基金重点项目,“跨语言社会舆情分析基础理论与关键技术研究”(批准号:61331013),2014.1-2018.12。
  2. 国家自然科学基金重点项目,“面向多层次篇章语义的机器翻译理论、方法与实现”(批准号:61432013),2015.1-2019.12。
  3. 清华信息科学与技术国家实验室(筹)大数据科学与技术专项,“以中文为枢轴的网络社交媒体大数据智能分析与高效计算的理论与方法”,2014.7-2015.6。
  4. 国家社会科学基金重大招标项目,“基于大规模社交媒体的汉语模因传播机理量化研究”(批准号:13&ZD190),2014.1-2016.12。
  5. 国家973计划,“面向三元空间的互联网中文信息处理理论与方法”(批准号:2014CB340500),2014.1-2018.8。
  6. 国家自然科学基金青年项目“基于协同语义计算的社交媒体信息扩散与可信性研究”(批准号:61202140),2013.1-2015.12。
  7. 国家863计划项目“大规模中文语义信息处理技术与系统”(批准号:2012AA011102),子课题,2012.1-2014.12。
  8. 国家自然科学基金面上项目“关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究”(批准号:61170196),2012.1-2015.12。
  9. 国家863计划项目“互联网语言翻译系统研制”(批准号:2011AA01A207),子课题,2011.1-2013.12。
  10. 国家自然科学基金重点项目“篇章级中文语义分析理论与方法”(批准号:61133012),子课题,2012.1-2016.12。
  11. 教育部人文社科重大课题攻关项目“中文信息处理面临的问题与对策研究”(批准号:10JZD0043),子课题,2011.12-2013.12。
  12. 国家自然科学基金青年项目“利用机器学习改进统计机器翻译的研究”(批准号:60903138),2010.1-2012.12。
  13. 国家科技支撑计划重点项目“少数民族语言文字信息处理共性关键技术研究与示范应用”(批准号:2009BAH41B04),子课题,2009.10-2012.10。
  14. 国家自然科学基金面上项目“汉语复杂网络的性质、结构、演化及其典型应用研究”(批准号:60873174),2009.1-2011.12。
  15. 国家863计划项目“大规模网络图文数据的语义分类和适度理解技术研究”(批准号:2007AA01Z148),2007.7-2009.12。
  16. 国家自然科学基金面上项目“中文文本自动分类关键技术研究”(批准号:60573187),2006.1-2008.12。
  17. 国家自然科学基金面上项目“汉语句法排歧知识的自动获取方法研究”(批准号:69705005),1997.1-1999.12。
横向项目
  1. 清华大学国际科技合作项目“媒体与网络技术教育部—微软重点实验室”,子课题,2011.11-2014.12
  2. 清华大学国际科技合作项目“面向中文文档分类的技术研发”,子课题,2011.10-2012.9
  3. 清华大学国际科技合作项目“针对流文本集的并行LDA”,2011.5-2012.5
  4. 清华大学国际科技合作项目“清华大学、新加坡国立大学下一代搜索研究中心”,2010.1-2014.10
  5. 清华大学国际科技合作项目“健壮的汉语自动分词与高性能的汉英双语文本对齐研究(二期)”,2009.10-2010.9

研究队伍

  • 作者:管理员
  • 分类:Demo
  • 点击数:60440

教师

  • 孙茂松,教授,博士生导师,研究方向为中文自然语言处理。
  • 刘洋,副教授,研究方向为中文自然语言处理,统计机器翻译。
  • 刘知远,助理研究员。研究方向为自然语言处理,社会计算。
  • 栾焕博,助理研究员。研究方向为社会计算应用。
  • 苑春法,教授,研究方向为中文自然语言处理(退休)。
  • 陈群秀,教授,研究方向为中文自然语言处理(退休)。

博士研究生

  • 杨麟儿,2008年入学,研究方向为微博挖掘。
  • 赵宇,2010年入学,研究方向为维基百科挖掘。
  • 陈新雄,2011年入学,研究方向为主题词分析。
  • 刘家骅,2012年入学,研究方向为句法分析。
  • 沈世奇,2012年入学,研究方向为机器翻译。
  • 哈里旦木·阿布都克里木,2012年入学,研究方向为少数民族语言处理。
  • 张檬,2013年入学,研究方为机器翻译。
  • 涂存超,2013年入学,研究方向为社会计算。
  • 阿雅娜,2013年入学,研究方向为文档摘要。
  • 林衍凯,2014年入学,研究方向为知识表示。
  • 杨成,2014年入学,研究方向为社会计算。
  • 陈慧敏,2015年入学。

硕士研究生

  • 柳春洋,2013年入学,研究方向为机器翻译。
  • 谢若冰,2014年入学,研究方向为知识表示。
  • 张嘉成,2015年入学,研究方向待定。
  • 武彬,2016年入学,研究方向待定。

曾经在本组的同学

  • 薛宇飞,2013年入组担任博士后,担任学堂在线科研工作。2015年7月出站。
  • 李莉,2012年入学,研究方向为短语分析。2015年7月毕业。
  • 董梅平,2012年入学,研究方向为机器翻译。2015年7月毕业。
  • 李鹏,2009年入学,研究方向为机器翻译。2015年1月毕业,毕业后到百度IDL工作。
  • 张燕,2005年入学,研究方向为输入法日志分析。2015年1月毕业。
  • 唐家渝,2011年入学,研究方向为信息可视化。2014年7月毕业,毕业后到TP-Link工作。
  • 匡冲,2011年入学,研究方向为推荐系统。2014年7月毕业,毕业后到人人贷工作。
  • 王璨,2010年入学,研究方向为中文维基百科信息挖掘。2013年7月毕业,硕士论文题目为“双语新闻自动对齐方法研究”,毕业后到人民搜索网络股份公司工作。
  • 刘奇,2010年入学,研究方向为机器翻译。2013年7月毕业,硕士论文题目为“互联网双语语料挖掘研究”,毕业后到总参谋部石家庄陆军指挥学院工作。
  • 张开旭,2007年入学,研究方向为中文分词。2012年7月毕业,博士论文题目为“使用压缩表示的中文分词词性标注研究”,毕业后到到厦门大学做博士后。
  • 蒋琪夏,2007年入学,研究方向为文本分类。2012年7月毕业,博士论文题目为“相似性搜索中的近似算法研究”。
  • 巴吐尔.艾沙,2007年入学,研究方向为统计自然语言处理。2012年7月毕业,博士论文题目为“维吾尔语的词法和浅层句法语义分析”,毕业后到新疆大学工作。
  • 雷升涛,2009年入学,研究方向为维吾尔语检索。2012年1月毕业,硕士论文题目为“维吾尔语搜索引擎的设计与实现”,毕业后到ThoughtWorks工作。
  • 李中国,2006年入学,研究方向为句法分析与词汇语义。2011年7月毕业,博士论文题目为“汉语词法与句法结构的统一分析”,毕业后到苏州大学工作。
  • 刘知远,2006年入学,研究方向为基于网络的自然语言处理方法。2011年7月毕业,博士论文题目为“基于文档主题结构的关键词抽取方法研究”,获得清华大学计算机系优秀博士毕业生称号,毕业后在清华大学做博士后。
  • 郑亚斌,2006年入学,研究方向为文本分类,基于图的半监督学习。2011年7月毕业,博士论文题目为“中文输入法用户行为分析及其应用”,获得清华大学计算机系优秀博士毕业生称号,毕业后去上海国信证券公司工作。
  • 王鹏,2008年入学,研究方向为输入法用户日志研究。2011年7月毕业,硕士论文题目为“基于输入法用户词库和查询日志的若干研究”,获得清华大学计算机系优秀硕士毕业生称号,毕业后去北京有道公司工作。
  • 谢丽星,2009年入学,研究方向为汉语缩略语抽取。2011年7月毕业,硕士论文题目为“基于SVM的中文微博情感分析的研究”,获得清华大学优秀硕士毕业生称号,毕业后去深圳博时基金公司工作。
  • 司宪策,2005年入学,研究方向为社会化标签的自动生成。2010年12月毕业,获得清华大学计算机系优秀博士毕业生称号,博士论文题目为“基于内容的社会标签推荐与分析研究”。毕业后去谷歌公司工作。
  • 乔维,2004年入学,研究方向为中文自动分词。2010年7月毕业,博士论文题目为“中文自动分词若干关键问题研究”。毕业后去中国电子信息产业发展研究院工作。
  • 柯武峰,2008年入学,研究方向为新词发现。2009年12月毕业,硕士论文题目为“基于Web的中英文术语自动抽取技术”。毕业后返原单位工作。
  • 曹红光,2008年入学,研究方向为基于内容的图像分类。2009年12月毕业,硕士论文题目为“基于中文文本的图像自动分类研究”。毕业后返原单位工作。
  • 刘挺,2008年入学,研究方向为文本过滤技术。2009年12月毕业,硕士论文题目为“特定领域网页文本过滤技术研究”。毕业后返原单位工作。
  • 李伟,2004年入学,研究方向为基于内容的图像检索。2009年12月毕业,博士论文题目为“基于内容的图像自动语义标注研究”。毕业后去Yahoo中国研究院工作。
  • 樊迪,硕士,2008年入学,研究方向为短文本数据挖掘。 2009年12月毕业,硕士论文题目为“中文短文本自动分类技术研究”。毕业后返原单位工作。
  • 滕少华,硕士。2007年入学,研究方向为中文分词。2009年6月毕业,硕士论文题目为“基于CRFs的中文分词和短文本分类技术”。毕业后去微软中国工作。
  • 李军,硕士,2006年入学,研究方向为文本褒贬义分析。2008年12月毕业,硕士论文题目为“中文评论的褒贬义分类实验研究”。毕业后去Comodo公司工作。
  • 刘贤俊,2006年开始做博士后,2008年出站到首都师范大学工作,2009年晋升为副教授。研究方向为现代汉语的语法与词汇。
  • 李景阳,博士,2008年毕业,博士论文题目为“文本分类中的特征选择和权重计算研究”,毕业后去百度公司工作。
  • 徐舒,硕士,2007年毕业,硕士论文题目为“基于ODP的中文文本自动分类技术”,毕业后去百度公司工作。
  • Emile Kroeger,美国人,硕士,2006年毕业,硕士论文题目为“Improving the Chinese Learner’s Dictionary with Character-based Lookup and Sentence Difficulty Evaluation”,毕业后去上海ubisoft育碧游戏软件公司工作。
  • 孙帆,硕士,2006年毕业,硕士论文题目为“转导支持向量机方法研究及其在文本分类中的应用”,毕业后去美国University of Southern California深造。
  • 张正操,硕士,2005年毕业,硕士论文题目为“基于内容的中文标题自动提取”。毕业后赴美国深造。
  • 薛德军,博士,2004年毕业,博士论文题目为“中文文本自动分类中的关键问题研究”,毕业后去清华同方知网知识传播工程技术研究院工作。
  • 许冬亮,硕士,2004年毕业,硕士论文题目为“汉语句子语义骨架的自动分析”,毕业后去百度公司工作。
  • 陈涛,硕士,2004年毕业,硕士论文题目为“基于自组织映射神经网络的词自动聚类”。毕业后到宁波大学工作,已晋升为副教授。
  • 王洪涛,硕士,2004年毕业,硕士论文题目为“基于语义的信息检索研究初步”。目前担任当当网技术部搜索与数据挖掘总监。
  • 罗盛芬,硕士,2004年毕业,硕士题目为“基于统计的汉语二字词自动抽取方法研究”。毕业后到广东省政府部门工作。
  • 罗霄,硕士,2003年毕业,硕士论文题目为“汉语自动分词中组合歧义消解与未登录词识别问题初探”。
  • 刘晓华,硕士,2002年毕业,硕士题目为“基于分词的中文搜索引擎研究”,毕业后去微软亚洲研究院工作。
  • 肖云,硕士,2001年毕业,硕士题目为“汉语自动分词中组合型歧义消解策略初探”,毕业后去美国雅虎公司工作。
  • 德爱礼,硕士,2001年毕业。
  • 奚晨海,硕士,2001年毕业。
  • 卢红娜,硕士,2000年毕业,硕士题目为“汉语文本检索中特征选择问题研究”。毕业后赴美国深造。现在纽约摩根士丹利(Morgan Stanley)工作。
  • 左正平,硕士,1998年毕业,硕士题目为“汉语自动分词中的若干问题”。毕业后赴美国深造。

曾经在本组进行学术访问的老师

  • 吐尔根·依布拉音教授,新疆大学信息学院院长,曾于2008-2010年在本组学术访问。
  • 亚森·伊明老师,新疆维吾尔自治区民族语言文字工作委员会委员,曾于2008-2010年在本组学术访问。
  • 阿迪拉老师,伊犁职业技术学院,曾于2009-2010年在本组学术访问。
  • 赵晖老师,新疆大学信息学院软件工程系主任,曾于2009-2010年在本组学术访问。
  • 巴吐尔·艾沙老师,新疆大学信息学院教师,曾于2006年在本组学术访问。
  • 麦麦提艾力.吐尔逊老师,新疆师范大学讲师,曾于2009.9-2011.7在新疆自治区人社部“少数民族骨干特殊培养”计划的支持下在本组学术访问。
  • 麦热哈巴.艾力老师,新疆大学信息学院副教授,曾于2010.9-2011.7在新疆自治区人社部“少数民族骨干特殊培养”计划的支持下在本组学术访问。
  • 于清老师,新疆大学信息学院副教授,曾于2011.10-2012.6在教育部“对口支援”计划的支持下在本组学术访问。

University theme for education website

  • 分类:Demo
  • 点击数:96

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus rutrum, libero id imperdiet elementum, nunc quam gravida mi, vehicula euismod magna lacus ornare mauris. Proin euismod scelerisque risus. Vivamus imperdiet hendrerit ornare.

阅读更多……

欢迎来到清华大学自然语言处理与社会人文计算实验室

  • 分类:Demo
  • 点击数:333

自然语言处理,简单地说,就是用计算机来处理人类的语言(英文、中文等)。由于语言是人类区别于动物的根本标志,没有语言,人类的思维也就无从谈起,所以自然语言处理体现了人工智能的最高任务与境界(只有当计算机具有处理语言的能力时,机器才可能通过图灵测试)。

自然语言处理带有很强的多学科交叉的性质(从学科的角度来看,自然语言处理也被称作“计算语言学”),涉及计算机科学、语言学、数学(尤其是统计学)、逻辑学、认知科学等多个领域。针对中文的自然语言处理,也被称作“中文信息处理”。主要研究内容包括:语言计算(语音与音位、词法、句法、语义、语用等各个层面上的计算),语言资源建设(计算词汇学、术语学、电子词典、语料库、知识本体等),机器翻译或机器辅助翻译,汉语和少数民族语言文字输入输出及其智能处理,中文手写和印刷体识别,中文语音识别及文语转换,信息检索,信息抽取与过滤,文本分类、中文搜索引擎,以自然语言为枢纽的多媒体检索,与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究,与语言计算相关的语言学研究,社会计算(特别是社交媒体计算),人文计算等。

中文信息处理(包括对汉语以及少数民族语言的信息处理)在我国信息领域科学技术进步与产业发展中占有特殊位置。历史地看,中文信息处理技术对推动我国信息科技与产业发展的贡献是巨大的。在一定程度上可以这么说,没有王选的汉字激光照排(两次获得国家科技进步一等奖),今天的方正集团就不会存在;没有倪光南的汉卡(获国家科技进步一等奖),也可能没有今天的联想集团;没有汉语拼音方案和王永民的五笔字型输入法,我国社会信息化范围就不会象今天这样广泛;没有刘迎建的汉王汉字输入系统(获国家科技进步一等奖),我们今天使用手机、PDA等就不会这么方便。类似的成功例子还有不少,如施水才的TRS信息检索系统,唐亚伟的速录机(获国家技术发明二等奖),陈肇雄的机器翻译系统(获国家科技进步一等奖)、丁晓青的清华文通汉字OCR系统(获国家科技进步二等奖)等等。这些无一不体现着鲜明的自主创新精神的成果,既是我国中文信息处理事业发展历程的见证,同时也将为其未来的继续蓬勃发展提供了宝贵的精神财富。

我们已经进入以互联网为主要标志的海量信息时代。一个与此相关的严峻事实是,数字信息有效利用已成为制约信息技术发展的一个全局性瓶颈问题。语言信息处理无可避免地成为信息科学技术中长期发展的一个新的战略制高点。《国家中长期科学和技术发展规划纲要》指出,我国将促进“以图像和自然语言理解为基础的‘以人为中心’的信息技术发展,推动多领域的创新”。目前,我们正处于两个基本背景之中:第一,以Google为典型代表的基于信息\知识处理的国际公司的崛起,正在形成比微软有过之而无不及的商业垄断以及对信息\知识有效利用的持续性、战略性控制;另一方面,经过长期的研究积累与技术沉淀,中文信息处理正处于酝酿重大突破的前夜。中文信息处理领域能否并且如何抓住这个新的历史机遇,迎接挑战,在新的历史条件下,发扬优良传统,争取更大光荣,将是在这个领域中辛勤耕耘着的我国科技工作者必须回答的一个重大问题。

清华大学计算机系自然语言处理课题组早在上个世纪七十年代末,就在黄昌宁教授的带领下从事这方面的研究工作,是国内开展相关研究最早、深具影响力的科研单位,同时也是中国中文信息学会(全国一级学会)计算语言学专业委员会的挂靠单位。现任学科带头人孙茂松教授任该专业委员会的主任(同时任中国中文信息学会副理事长)。本课题组现正瞄准以中文为核心的自然语言处理中的若干前沿课题,进行系统、深入的研究,研究领域的涵盖面正逐步从计算语言学的核心问题扩展到社会计算和人文计算。

Private Pesticide Applicators Training

  • 分类:Demo
  • 点击数:103

Event Details:

  • Date: 2016
  • Venue:Poland, Krynica-Zdroj 246a
  • Register

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus rutrum, libero id imperdiet elementum, nunc quam gravida mi, vehicula euismod magna lacus ornare mauris. Proin euismod scelerisque risus. Vivamus imperdiet hendrerit ornare. Phasellus dapibus imperdiet nibh, nec sagittis odio condimentum sed. Phasellus dignissim, massa nec ornare fermentum, ligula massa varius dolor, a interdum nisl purus eu magna.

阅读更多……

Students choose accounting lecturer

  • 分类:Demo
  • 点击数:103

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus rutrum, libero id imperdiet elementum, nunc quam gravida mi, vehicula euismod magna lacus ornare mauris. Proin euismod scelerisque risus. Vivamus imperdiet hendrerit ornare.

阅读更多……

Log in