最新动态

OpenMatch:开放域信息检索开源工具包

清华大学自然语言处理与社会人文计算实验室近日开源了开放域信息检索工具包:OpenMatch和神经网络信息检索必读论文集:NeuIRPapers。OpenMatch是清华大学计算机系与微软研究院团队联合完成的成果,基于Python和PyTorch开发,它具有两大亮点:一是为用户提供了开放域下信息检索的完整解决方案,并通过模块化处理,方便用户定制自己的检索系统。二是支持领域知识的迁移学习,包括融合外部...
了解更多

计算人文新进展:大数据为选辑中华古诗词经典另辟蹊径

中国古典诗词多如繁星,对平素忙碌于各行各业的人士来说,抽空读哪些诗词更好呢?显然应从最基本的诗词读起,最好熟读到能够背诵下来。唐代是我国诗词文化格外璀璨的历史时期。近日,清华大学人工智能研究院自然语言处理与社会人文研究中心(THUNLP)特面向大众选辑推荐最受近现代人喜爱的唐代诗词三百首(TangPoemTop300)。 与迄今为止其他甄选方式不同,我们根据文本大数据精选了最受近现代人欢迎的300...
了解更多

专著《Representation Learning for Natural Language Processing》正式出版!

语义表示是自然语言处理的基础,我们需要将原始文本数据中的有用信息转换为计算机能够理解的语义表示,才能实现各种自然语言处理应用。表示学习旨在从大规模数据中自动学习数据的语义特征表示,并支持机器学习进一步用于数据训练和预测。以深度学习为代表的表示学习技术,能够灵活地建立对大规模文本、音频、图像、视频等无结构数据的语义表示,显著提升语音识别、图像处理和自然语言处理的性能,近年来引发了人工智能的新浪潮。本...
了解更多

清华大学自然语言处理与社会人文计算实验室招聘科研助理

受疫情影响,部分2020届毕业生出国深造的计划被延期,为了帮助这些优秀毕业生顺利地完成两个学业阶段的衔接与过渡,实验室公开招聘科研助理。 实验室简介 清华大学计算机系自然语言处理与社会人文计算实验室成立于 20 世纪七十年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位之一,也是中国中文信息学会(全国一级学会)计算语言学专业委员会及中国人工智能学会(全国一级学会)不确定性人工智能专业委员...
了解更多

九歌多样化古典诗歌机器写作模型MixPoet开源

中文古典诗歌形式规则,表达凝练,同时具有丰富的情感和内容,是研究文学性文本自动理解和生成的重要切入点。近年来诗歌自动写作这一任务在自然语言生成领域逐渐受到重视, 多个不同的模型相继被提出。然而大多数模型只关注到评价诗歌质量的一些基本指标(如上下文连贯性,扣题程度,韵律的匹配),却忽略了生成诗歌的多样性。 图1 :一个基础的Seq2Seq模型依据两个不同的关键词生成的两首五绝。 如图1所示,当我们输...
了解更多

CCL 2020即将截稿!

第十九届中国计算语言学大会(The Nineteenth China National Conference on Computational Linguistics, CCL 2020) 论文投稿将于 2020年6月22日 截止,欢迎赐稿。 更多会议详情,请点击下方二维码进入官网...
了解更多

截稿延期 | 第十九届中国计算语言学大会(CCL 2020) 征稿顺延至6月22日

由于疫情影响,经过程序委员会讨论 , “第十九届中国计算语言学大会”(The Nineteenth China National Conference on Computational Linguistics, CCL 2020)决定将投稿截止日期顺延至 2020年6月22日24时(北京时间) 。 CCL 2020程序委员会 2020年6月16日 第十九届中国计算语言学大会(CCL 2020) ...
了解更多

计算人文新进展:中国古典诗词预训练模型BERT-CCPoem开源

近日,清华大学人工智能研究院自然语言处理与社会人文计算研究中心在GitHub上开源了中国古典诗词预训练模型BERT-CCPoem(BERT-based Pre-trained Model for Chinese Classical Poetry)。 BERT-CCPoem是完全基于一个囊括了几乎所有中国古典诗词的语料库CCPC-Full v1.0训练而成的,该语料库共计926,024首诗词及8,9...
了解更多

专著《知识图谱与深度学习》正式出版发售!

知识就是力量,人工智能想要让计算机像人一样思考,同样需要知识的力量。计算机实现人工智能需要哪些知识,这些知识要如何表示、获取、计算以及使用,都是人工智能的重要研究课题。知识图谱作为人类知识结构化形成的知识系统,是人工智能研究和智能信息服务的基础核心技术,被广泛应用于搜索引擎、问答系统、智能对话系统以及个性化推荐等知识驱动的领域。 围绕知识图谱和自然语言处理的诸多挑战问题,清华大学自然语言处理实验室...
了解更多

中国计算语言学大会(CCL 2020)技术评测任务发布

“第十九届中国计算语言学大会”(The Nineteenth China National Conference on Computational Linguistics, CCL 2020)将于2020年10月30日—11月1日在海口举行,会议主办单位为中国中文信息学会,承办单位为海南大学。本次大会继续组织中文技术评测。经过前期评测任务征集与筛选,评测委员会最终确定了5个评测任务:智源-京东多模...
了解更多
2
...