新闻 | 我组2篇论文被COLING 2018录用
2018-05-19

 

计算语言学国际会议COLING 2018The 27th International Conference on Computational Linguistics)将于2018年8月20日至26日在美国圣达菲举行,由ICCL(International Committee on Computational Linguistics)主办。COLING为自然语言处理领域最重要的国际会议之一,每两年举办一次。

 

录取论文介绍:

Few-Shot Charge Prediction with Discriminative Legal Attributes

作者:胡紫昆、李想、涂存超、刘知远、孙茂松

领域:法律智能

简介:

自动罪名预测目的是根据案件的事实描述来自动地决定刑事案件中被告的罪名。罪名预测任务一般被当作一个文本分类任务,利用案件相关的浅层的文本特征(词、短语)或者属性特征(日期、地点、类型等)来预测结果。近些年来,基于神经网络的分类模型也被应用到罪名预测任务中。然而,这些已有的工作不能很好的处理低频罪名的预测以及混淆罪名的预测。在本文中,我们提出了一种基于区分性属性的罪名分类模型,通过引入十个有区分性的罪名属性(是否盈利、是否有买卖行为、是否有死亡情节、是否有暴力行为等),来作为事实描述到罪名的中间映射。通过利用注意力机制生成与属性相关的事实表示,对一个案件的不同属性进行预测,来进一步预测最终的罪名结果。在不同规模的真实数据集上的结果表明,我们提出的模型显著地优于所有的基准方法,并且在低频罪名上获得了接近50%的提升。

 

Adversarial Multi-lingual Neural Relation Extraction

作者:王晓智*、韩旭*、林衍凯、刘知远、孙茂松(*同等贡献)

领域:关系抽取

简介:

多语言关系抽取(Multi-lingual relationextraction)旨在从来自多种语言的文本中自动发现给定实体对的关系。已有的多语言关系抽取模型并不能够很好地捕捉不同语言间关系模式的一致性和多样性。为了解决这个问题,本文提出了基于对抗训练的多语言神经关系抽取模型( Adversarial Multi-lingual Neural Relation Extraction,AMNRE)。该模型将不同语言文本映射到相应的特有语言空间进行语言特性的提取,同时也将所有语言的文本映射到统一的共有语义空间,并采用对抗机制以保证能够有效抽取出语言一致性特征。通过显式考虑语言间的一致性特征以及每种语言的特有信息,多语言关系抽取的效果得到了显著提升。在真实数据集上的实验表明,与已有的基线模型相比,我们的模型能够取得更佳的效果。