最新动态

新闻 | 我组3位同学顺利通过博士学位论文答辩

2022年5月17日下午,我组3名博士同学(岂凡超、黄轩成、韩旭)博士学位论文答辩在线上举行。答辩委员会成员包括马少平、孙茂松、周明、孙乐、李涓子、刘洋、刘康、刘知远。 线上答辩合影 答辩会上,岂凡超同学以义原知识与神经网络融合的文本语义计算为研究背景,提出了融入义原的复合词表示学习和基于义原的无监督词义消歧方法,并实现了融入义原的句子表示学习模型和对抗样本生成模型。黄轩成同学面向多源序列到序列生...
了解更多

《数字人文》专家面对面 | 第一讲:浅谈人工智能背景下的数字人文

在数字化时代应运而生的数字人文,是借助计算机和数据科学等方法和手段进行的人文研究,究其性质是一门交叉学科,也是一种方法论。它将数字技术运用于人文阐释,是由媒介变革引发的知识生产范式的一次转型。 数字化浪潮无所不在,也正在改变着包括人文研究在内的学术领域。数字环境下可以发现前数字时代难以发现的现象,提出前数字时代下难以提出的设想,开展前数字时代难以开展的工作,解决前数字时代难以解决的问题。这些问题往...
了解更多

数字让人文更新 | 刘石 孙茂松

刘   石 / 清华大学人文学院 孙茂松 / 清华大学计算机科学与技术系 日前,中共中央办公厅、国务院办公厅印发《关于推进新时代古籍工作的意见》,共五个方面18条,内容全面,要求明确,指导性强,鼓舞人心。对于我们来说,其中的第12条:“推进古籍数字化。建立健全国家古籍数字化工作指导协调机制,统筹实施国家古籍数字化工程。积极对接国家文化大数据体系,加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共...
了解更多

新闻 | THUNLP实验室本科生赵威霖入选清华大学“未来学者”

近日,2022年清华大学大学生学术研究推进计划“未来学者”专项入选名单发布,本次全校共有 9 个项目通过现场答辩,我组本科生赵威霖同学入选。赵威霖,清华大学计算机系本科三年级,目前在清华大学自然语言处理实验室从事预训练语言模型、参数高效微调、模型计算加速相关研究。在ACL Demo Track 2022以共同第一作者身份发表两篇论文,相关工作OpenPrompt/Delta、BMInf在Githu...
了解更多

招聘—清华NLP实验室刘洋老师招聘1-3名工程师

本实验室刘洋老师拟招聘1-3名工程师,负责自然语言处理相关算法的实现、参与相关学术工作,以及网站前端后端开发与维护等。欢迎对自然语言处理感兴趣的计算机专业毕业生加入我们。 清华大学计算机系自然语言处理与社会人文计算实验室成立于 20 世纪七十年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位,也是中国中文信息学会计算语言学专业委员会及中国人工智能学会不确定性人工智能专业委员会的挂靠单位。...
了解更多

WantWords:想形容那个啥特别那什么,怎么个词来着?点进内文就有答案

“怎么形容春天的生机让人觉得很开心?” “如何形容消失在人海之中?” “如何描述夏日暴雨?” 在豆瓣文字失语者互助联盟,超过 30 万人在给自己的语言能力“举哑铃”。越来越多的人患上了这种时代病——不知如何将感受化为文字,或话到嘴边却发现词不达意、言不由衷。在厌倦了网络用语复读机似的轰炸之后,我们如何找回正常的语言表达? 机器有答案。 输入你想要表达的意思,就能获得对应的词语,名为 WantWor...
了解更多

清华大学NLP实验室招聘数据工程师

清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)是国内开展自然语言处理研究最早、深具影响力的科研单位,也是中国中文信息学会计算语言学专业委员会及中国人工智能学会不确定性人工智能专业委员会的挂靠单位。实验室围绕以中文为核心的自然语言处理,在语言信息处理、机器翻译、社会计算、智慧教育和知识图谱等方面开展系统深入的研究,在国内外具有较大的学术影响。近年来,实验室承担了国家重点研发项目、国...
了解更多

征稿启事 | 第二十一届中国计算语言学大会(CCL 2022)第二轮征稿进行中

“第二十一届中国计算语言学大会”(The Twenty-first China National Conference on Computational Linguistics, CCL 2022)将于2022年10月14-16日在江西南昌举行,会议由江西师范大学承办。中国计算语言学大会创办于1991年,由中国中文信息学会计算语言学专业委员会负责组织。经过30余年的发展,中国计算语言学大会已成为国...
了解更多

新闻 | 我组5篇论文被NAACL-HLT 2022录用

今日,NAACL-HLT  2022录用结果出炉,我组5篇论文被录用,其中主会论文4篇,Findings论文1篇。以下为论文列表及介绍: Fuse It More Deeply! A Variational Transformer with Layer-Wise Latent Variable Inference for Text Generation 作者:胡锦毅,矣晓沅,李文浩,孙茂松,谢幸 ...
了解更多

与统计相遇|当统计学遇上开放域中文分词

近年来,自然语言处理(Natural Language Processing, 简称NLP)领域发展迅猛。在中文自然语言处理(Chinese Natural Language Processing, 简称CNLP)中,词汇之间缺少边界,故文本分词和词汇发现是中文文本分析的首要任务,也是下游分析任务(如文本分类、情感分析等)的基础。本文介绍了通过统计学框架将中文分词和词汇发现有机结合的方法--Top...
了解更多
3
...