新闻 | 即将成立!清华大学人工智能研究院自然语言处理与社会人文计算研究中心
2019-06-29

清华大学人工智能研究院自然语言处理与社会人文计算研究中心成立仪式将于7月1日下午14:00在清华大学FIT楼多功能厅举行。

人工智能是当代科技前沿,更是未来科技发展的战略制高点。清华大学是国内最早系统开展人工智能研究的单位之一。1978年清华大学计算机系成立了“人工智能与智能控制”教研组;1990年清华大学建成了“智能技术与系统国家重点实验室”;2018年6月28日清华大学成立了人工智能研究院,旨在实现人工智能基础理论和方法创新,力争成为具有国际影响力的人工智能高端研究机构。自然语言处理与社会人文计算研究中心作为清华大学人工智能研究院建院一周年之际的第八个研究中心,是研究院整合校内优势研究力量、推动人工智能原始创新的重要举措,也是人工智能研究院发展一个新的里程碑。

语言是人类区别于其他动物的根本标志,没有语言,人类的思维也就无从谈起。自然语言处理旨在让计算机掌握理解与处理人类语言的能力,体现了人工智能的最高任务与境界,只有当计算机具有处理语言的能力时,机器才可能通过图灵测试。自然语言处理与社会人文计算研究中心将紧密围绕人类语言所体现的人类智能本质,重点研究鲁棒、可解释的自然语言处理方法与技术,深入探索语言理解与生成技术在社会人文计算领域的应用,努力建设以中文为核心、覆盖多种语言、从词法到篇章的全流程自然语言处理技术框架与计算平台,力争产出以智能创作、智能语言学习、智能教育、智能司法为代表的、具有国际学术影响力、重大民生意义的社会人文计算研究成果。

研究中心聘请加拿大皇家科学院院士、加拿大滑铁卢大学讲座教授李明,微软亚洲研究院副院长、国际计算语言学会会长周明,英国皇家工程院院士、英国帝国理工学院教授郭毅可担任中心学术顾问。李明教授和周明博士将在成立仪式上做精彩的前沿学术报告。此外,中心研究团队还将开源发布数据驱动的机器翻译、基于深度学习的中文诗歌自动生成系统以及知识指导的自然语言预训练模型等最新研究成果。

李明.png

报告人:李明

报告题目:第二代对话机器人

讲者简介:李明,加拿大皇家科学院院士、ACM/IEEE Fellow、加拿大滑铁卢大学讲座教授、薄言信息技术公司董事长。博士毕业于康奈尔大学。他在研究机器学习,算法平均复杂度,信息距离,自然语言处理,和生物信息学方面做出了贡献。在Nature, PNAS, Scientific American,JACM, CACM, FOCS, STOC 等杂志会议发表过许多有影响的文章。他是世界上研究Kolmogorov Complexity的权威专家,曾于2010年获得有“加拿大诺贝尔奖”的国家最高科学奖 Killam Award。

周明.png

报告人:周明

报告题目:关于神经网络自然语言处理的思考

讲者简介:周明,微软亚洲研究院副院长、国际计算语言学会会长、微软-清华联合实验室主任、中国计算机学会中文信息技术(NLP)专委会主任、中国中文信息学会常务理事、哈工大等五所著名高校的博士生导师。博士毕业于哈尔滨工业大学。他多年来从事自然语言处理研究包括中国最早的中英机器翻译系统 CEMT(1989年)、日本著名的中日机器翻译产品J-北京(1998年)、电脑对联、在线词典、新一代搜索引擎、知识图谱、人机对话、聊天机器人、阅读理解、推荐系统等。发表论文200余篇,包括70篇以上的ACL文章。主编《机器翻译》、《智能问答》,参编《人工智能导论》等专著。曾获得华尔街日报亚洲创新奖(2010年)、微软CEO萨提亚颁发的AbilityAward(2014年)、首都劳动奖章(2018年)。

开源成果介绍

1.THUMT—数据驱动的机器翻译

面向“一带一路”多语言信息智能处理的迫切需求,探索数据驱动的神经翻译模型算法与模型,从面向机器翻译的表示学习方法、融合先验知识的神经翻译模型和面向低资源语言的模型训练方法三个方面开展研究工作。研制了支持汉语、英语、日语、俄语、西班牙语、葡萄牙语、德语、法语、阿拉伯语、维吾尔语等关键语言的机器翻译系统,应用于外交部、新疆公检法等政府重要部门和搜狗、百度、捷通华声等互联网企业,在大规模多语言信息深度分析处理和高效服务方面做出贡献,相关产品广泛应用于互联网、金融、能源、电信、交通等行业领域。在自然语言处理重要国际期刊和会议发表70余篇论文,获得ACL 2017杰出论文奖。研究成果获得2015年国家科技进步二等奖和2014年中国电子学会科技进步一等奖等科技奖励。

基于神经网络的机器翻译.png

基于神经网络的机器翻译

研究成果应用于搜狗等互联网企业.png

研究成果应用于搜狗等互联网企业

多语言在线翻译系统.png

多语言在线翻译系统

2.THUAIPoet—基于深度学习的中文诗歌自动生成系统

基于深度神经网络技术,研制人工智能古典诗词自动写作系统“九歌”(https://jiuge.thunlp.cn//),曾参加中央电视台CCTV-1《机智过人》节目,与人类诗人同台竞技,取得了几乎可与人媲美的效果。相关视频在主流社交媒体上用户观看超过1000万次(http://tv.cctv.com/2017/12/15/VIDElvnrl62D0n8Sdv0it84m171215.shtml)。在顶级国际会议上发表了一系列学术论文。

九歌APP界面.png

九歌APP界面

九歌系统登上CCTV机智过人节目.png

九歌系统登上CCTV机智过人节目

九歌系统访问二维码.png

九歌系统访问二维码

3.THUPM—知识指导的自然语言预训练模型
 

2018年起,以BERT为代表的模型,能够利用大规模无标注文本学习预训练模型,在自然语言处理各重要任务上均取得显著性能提升,引起学术界和产业界的广泛关注。实际上,文本中往往包含丰富的人类知识,如实体间复杂关系等。已有预训练模型无法考虑知识图谱中的结构化知识。中心团队认为,结构化知识可以指导预训练模型,提升模型对文本中低频实体的理解能力。因此,提出一种融合知识图谱实体表示和相应预测任务的预训练模型(ERNIE),阐述该模型的论文已经被ACL 2019录用。

文本深度理解需要知识的支持.png

文本深度理解需要知识的支持

知识指导的预训练模型ERNIE框架图.png

知识指导的预训练模型ERNIE框架图

附:中心成立仪式暨前沿学术报告与开源成果发布会日程安排

清华大学人工智能研究院自然语言处理与社会人文计算研究中心成立仪式

暨前沿学术报告与开源成果发布会 

时  间:2019年7月1日

地  点:FIT楼多功能厅(2层)

领导与部分嘉宾:

尤 政  中国工程院院士、清华大学副校长、人工智能研究院管委会主任

张 钹  中国科学院院士、清华大学人工智能研究院院长

黄昌宁  清华大学计算机系资深教授

陈群秀  清华大学计算机系资深教授

李 明  加拿大皇家科学院院士、加拿大滑铁卢大学讲座教授

周 明  微软亚洲研究院副院长、国际计算语言学会会长

申卫星  清华大学法学院院长

孙茂松  清华大学人工智能研究院常务副院长

朱 军  清华大学人工智能研究院院长助理  

日程.png

中心成立仪式暨前沿学术报告与开源成果发布会向社会各界开放,欢迎广大朋友参加!