教师队伍
研究方向为自然语言处理、人工智能、大模型、中文信息处理、以及社会、人文和艺术计算等。
研究方向为自然语言处理、机器翻译
研究方向为知识图谱与语义计算、 社会计算与计算社会科学
研究方向为社会计算
客座研究员
刘正皓
研究方向为稠密向量检索、多模态检索以及面向大语言模型的数模孪生等
王硕
研究方向为流式多语言信息处理,预训练语言模型
闫宇坤
研究方向为自然语言处理、预训练语言模型
王洪振
研究方向为大模型SFT研究,多模态、OCR、目标检测和语义分割
赵海岩
研究方向为预训练语言模型、模型基础架构
安荣巧
研究方向为大模型SFT训练、多模态图文预训练和目标检测
马强
研究方向为端侧模型、端云协同协议和架构
徐旺
研究方向为自然语言处理、知识图谱、预训练语言模型
施琦
研究方向为自然语言处理、代码生成、大模型安全
博士后研究员
李霜洁 博士后
研究方向为计算甲骨学
韩旭 博士后
研究方向为自然语言处理、知识图谱、预训练语言模型
钱忱 博士后
研究方向为自然语言处理、预训练语言模型、群体智能
从鑫 博士后
研究方向为自然语言处理、预训练语言模型、工具学习
时磊 博士后
研究方向为多模态预训练、具身智能
张众 博士后
研究方向为自然语言处理、预训练语言模型、工具学习
孔存良 博士后
研究方向为自然语言处理、预训练语言模型
科研助理 & 工程师
王宇星
许诚强
刘月美
周鹏
蔡思源
许缘伟
段江雨
博士研究生
吕庆辉
吕庆辉
2016年入学
陈驰.jpg
陈驰
2019年入学
郑远航
郑远航
2019年入学
张正彦
2019年入学
崔淦渠-2019级博士.jpg
2019年入学
张新荣.jpg
张新荣
2019年入学
杨宗瀚
2020年入学
肖朝军
2020年入学
huangyufei.png
2020年入学
zengzhenipng.png
2020年入学
秦禹嘉.jpg
2020年入学
李文浩.jpg
李文浩
2020年入学
41-胡声鼎.jpg
2020年入学
微信截图_20210630153629.png
陈暐泽
2021年入学
于是.jpg
于是
2021年入学
矫瑞.jpg
矫瑞
2021年入学
胡锦毅—大图.jpg
胡锦毅
2021年入学
白钰卓-2022级博士 拷贝.jpg
白钰卓
2022年入学
孔详哲-2022级博士.jpg
2022年入学
王晓龙-2022级博士.JPG
王晓龙
2022年入学
王梓玥-2022级博士.jpeg
王梓玥
2022年入学
宋晨阳-2022级博士.jpg
宋晨阳
2022年入学
赵威霖 (2).jpeg
赵威霖
2023年入学
罗宇琦_1.png
罗宇琦
2023年入学
硕士研究生
王聿中.jpg
王聿中
2021年入学
贺超群.jpg
贺超群
2021年入学
梁念宁.jpg
梁念宁
2021年入学
杨泽远1.jpeg
杨泽远
2021年入学
微信图片_20210729172026.jpg
张原驰
2021年入学
程立志-2022级硕士.jpg
程志立
2022年入学
张皓烨1.jpg
张皓烨
2022年入学
微信图片_202211080936281.jpg
陈英发
2022年入学
王治同_1.png
王治同
2023年入学
叶奕宁 (1).jpeg
叶奕宁
2023年入学
曾经在本组的同学
苏裕胜
博士,2019年入学,2023年毕业,博士题目为“预训练语言模型的高效微调方法研究”
姚远
博士,2018年入学,2023年毕业,博士题目为“面向多模态数据的大规模结构化知识获取”
周沁弘
硕士,2020年入学,2023年毕业,硕士题目为“预训练语言模型知识蒸馏的决策驱动与数据选择方法研究”
陈语童
硕士,2020年入学,2023年毕业,硕士题目为“从图像到中国古诗句的跨模态检索技术研究”
张慧盟
硕士,2019年入学,2022年毕业,硕士题目为“面向结构化文档机器翻译的预训练语言模型研究”。
黄轩成
博士,2017年入学,2022年毕业,博士题目为“面向机器翻译的多源序列到序列生成方法研究”。
硕士,2018年入学,2021年毕业,硕士题目为“面向文本与符号知识的复杂推理方法研究”。
硕士,2018年入学,2021年毕业,硕士题目为“基于大规模弱监督数据的神经网络信息检索模型研究”。
杜家驹
硕士,2018年入学,2021年毕业,硕士题目为“中文开放域问答方法研究与系统”。毕业后将加入腾讯公司从事技术研发工作。
博士,2015年入学,2021年毕业,博士题目为“低资源条件下的神经机器翻译方法研究”。毕业后将加入阿里巴巴达摩院从事研究工作。
刘家骅
2012年入学,研究方向为自动问答,2020年6月毕业。
2015年入学,研究方向为情感计算,2020年6月毕业,毕业后赴清华大学新闻系担任博士后。
郭志芃
2017年入学,2020年6月毕业。
阿雅娜
2013年入学,研究方向为文档摘要,2019年6月毕业,博士论文题目为“神经网络标题生成的偏差消除问题研究”,毕业赴内蒙古大学任教。
林衍凯
2014年入学,研究方向为知识表示,2019年6月毕业,博士论文题目为“大规模结构化知识的 表示学习、自动获取与计算应用”, 毕业赴腾讯微信AI部门工作。
漆毅
2016年入学, 2019年6月毕业。
武彬
2016年入学,2019年6月毕业。
张檬
2013年入学,研究方为机器翻译,2018年6月毕业,毕业赴华为诺亚方舟实验室工作。
张菡
2015年入学,2018年6月毕业。
陈翱
2014年入学,2017年6月毕业。
柳春洋
2013年入学,研究方向为机器翻译,2016年6月毕业。
杨麟儿
2008年入学,研究方向为句法分析。
赵宇
2010年入学,研究方向为维基百科挖掘。
李莉
2012年入学,研究方向为短语分析。2015年7月毕业。
薛宇飞
2013年入组担任博士后,担任学堂在线科研工作。2015年7月出站。
唐家渝
2011年入学,研究方向为信息可视化。2014年7月毕业,毕业后到TP-Link工作。
王璨
2010年入学,研究方向为中文维基百科信息挖掘。2013年7月毕业,硕士论文题目为“双语新闻自动对齐方法研究”,毕业后到人民搜索网络股份公司工作。
巴吐尔.艾沙
2007年入学,研究方向为统计自然语言处理。2012年7月毕业,博士论文题目为“维吾尔语的词法和浅层句法语义分析”,毕业后到新疆大学工作。
张开旭
2007年入学,研究方向为中文分词。2012年7月毕业,博士论文题目为“使用压缩表示的中文分词词性标注研究”,毕业后到到厦门大学做博士后。
王鹏
2008年入学,研究方向为输入法用户日志研究。2011年7月毕业,硕士论文题目为“基于输入法用户词库和查询日志的若干研究”,获得清华大学计算机系优秀硕士毕业生称号,毕业后去北京有道公司工作。
刘知远
2006年入学,研究方向为基于网络的自然语言处理方法。2011年7月毕业,博士论文题目为“基于文档主题结构的关键词抽取方法研究”,获得清华大学计算机系优秀博士毕业生称号,毕业后在清华大学做博士后。
乔维
2004年入学,研究方向为中文自动分词。2010年7月毕业,博士论文题目为“中文自动分词若干关键问题研究”。毕业后去中国电子信息产业发展研究院工作。
滕少华
硕士。2007年入学,研究方向为中文分词。2009年6月毕业,硕士论文题目为“基于CRFs的中文分词和短文本分类技术”。毕业后去微软中国工作。
李伟
2004年入学,研究方向为基于内容的图像检索。2009年12月毕业,博士论文题目为“基于内容的图像自动语义标注研究”。毕业后去Yahoo中国研究院工作。
曹红光
2008年入学,研究方向为基于内容的图像分类。2009年12月毕业,硕士论文题目为“基于中文文本的图像自动分类研究”。毕业后返原单位工作。
李景阳
博士,2008年毕业,博士论文题目为“文本分类中的特征选择和权重计算研究”,毕业后去百度公司工作。
徐舒
硕士,2007年毕业,硕士论文题目为“基于ODP的中文文本自动分类技术”,毕业后去百度公司工作。
Emile Kroeger
美国人,硕士,2006年毕业,硕士论文题目为“Improving the Chinese Learner’s Dictionary with Character-based Lookup and Sentence Difficulty Evaluation”,毕业后去上海ubisoft育碧游戏软件公司工作。
罗盛芬
硕士,2004年毕业,硕士题目为“基于统计的汉语二字词自动抽取方法研究”。毕业后到广东省政府部门工作。
陈涛
硕士,2004年毕业,硕士论文题目为“基于自组织映射神经网络的词自动聚类”。毕业后到宁波大学工作,已晋升为副教授。
薛德军
博士,2004年毕业,博士论文题目为“中文文本自动分类中的关键问题研究”,毕业后去清华同方知网知识传播工程技术研究院工作。
刘晓华
硕士,2002年毕业,硕士题目为“基于分词的中文搜索引擎研究”,毕业后去微软亚洲研究院工作。
德爱礼
硕士,2001年毕业。
易婧
硕士,2020年入学,2023年毕业,硕士题目为“探索增量微调方法的统一优化子空间”
左正平
硕士,1998年毕业,硕士题目为“汉语自动分词中的若干问题”。毕业后赴美国深造。
叶德铭
博士,2018年入学,2023年毕业,博士题目为“多源知识增强的预训练语言模型”
王硕
博士,2018年入学,2023年毕业,博士题目为“推断可控的神经机器翻译方法研究”
王凤玉
硕士,2020年入学,2023年毕业,硕士题目为“基于提示的受控文本生成研究”
赵欣昊
硕士,2020年入学,2023年毕业,硕士题目为“基于深度学习的文档自动摘要研究”
许一舟
硕士,2019年入学,2022年毕业,硕士题目为“药物推荐中的异质健康信息融合方法研究”。
岂凡超
博士,2017年入学,2022年毕业,博士题目为“义原知识与神经网络融合的文本语义计算研究”。
钟皓曦
硕士,2021年毕业,硕士题目为“面向刑事案件的判决预测方向研究”。毕业后将加入腾讯从事研发工作。
陈刚
硕士,2018年入学,2021年毕业,硕士题目为“基于隐变量模型的故事生成方法研究”。
刘正皓
博士,2016年入学,2021年毕业,博士题目为“融合富信息的英文文本自动校对”。毕业后将以人才引进形式加入东北大学从事教育、科研工作。
矣晓沅
博士,2016年入学,2021年毕业,博士题目为“具有文学表现力的中文古典诗歌自动写作方法研究”。毕业后将加入微软亚洲研究院从事NLP相关研究工作。
张嘉成
2015年入学,研究方向为机器翻译,2020年6月毕业。
刘阳光
2017年入学,2020年6月毕业。
郭书宇
硕士,2019年入学,2023年毕业,硕士题目为“慕课教学分析预测与学习者行为干预系统”,毕业去向江苏省委组织部
杨成
2014年入学,研究方向为社会计算,2019年6月毕业,博士论文题目为“富信息网络表示学习及典型应用问题研究”,毕业赴北京邮电大学任教。
梁健楠
2015年入学,2019年6月毕业。
丁延卓
2016年入学,2019年6月毕业。
哈里旦木·阿布都克里木
2012年入学,研究方向为少数民族语言处理。2018年1月毕业。
涂存超
2013年入学,研究方向为社会计算,2018年6月毕业,博士论文题目为“面向社会计算的网络表示学习”,毕业入组担任博士后。2020年7月出站。
沈世奇
2012年入学,研究方向为机器翻译,2017年6月毕业。
谢若冰
2014年入学,研究方向为知识表示,2017年6月毕业,硕士论文题目为“融合多源信息的知识表示学习研究”,毕业去腾讯微信部门工作。
张燕
2005年入学,研究方向为输入法日志分析。2015年1月毕业。
李鹏
2009年入学,研究方向为机器翻译。2015年1月毕业,毕业后到百度IDL工作。
陈新雄
2011年入学,研究方向为主题词分析。
董梅平
2012年入学,研究方向为机器翻译。2015年7月毕业。
匡冲
2011年入学,研究方向为推荐系统。2014年7月毕业,毕业后到人人贷工作。
刘奇
2010年入学,研究方向为机器翻译。2013年7月毕业,硕士论文题目为“互联网双语语料挖掘研究”,毕业后到总参谋部石家庄陆军指挥学院工作。
雷升涛
2009年入学,研究方向为维吾尔语检索。2012年1月毕业,硕士论文题目为“维吾尔语搜索引擎的设计与实现”,毕业后到ThoughtWorks工作。
蒋琪夏
2007年入学,研究方向为文本分类。2012年7月毕业,博士论文题目为“相似性搜索中的近似算法研究”。
谢丽星
2009年入学,研究方向为汉语缩略语抽取。2011年7月毕业,硕士论文题目为“基于SVM的中文微博情感分析的研究”,获得清华大学优秀硕士毕业生称号,毕业后去深圳博时基金公司工作。
郑亚斌
2006年入学,研究方向为文本分类,基于图的半监督学习。2011年7月毕业,博士论文题目为“中文输入法用户行为分析及其应用”,获得清华大学计算机系优秀博士毕业生称号,毕业后去上海国信证券公司工作。
李中国
2006年入学,研究方向为句法分析与词汇语义。2011年7月毕业,博士论文题目为“汉语词法与句法结构的统一分析”,毕业后到苏州大学工作。
司宪策
2005年入学,研究方向为社会化标签的自动生成。2010年12月毕业,获得清华大学计算机系优秀博士毕业生称号,博士论文题目为“基于内容的社会标签推荐与分析研究”。毕业后去谷歌公司工作。
樊迪
硕士,2008年入学,研究方向为短文本数据挖掘。 2009年12月毕业,硕士论文题目为“中文短文本自动分类技术研究”。毕业后返原单位工作。
刘挺
2008年入学,研究方向为文本过滤技术。2009年12月毕业,硕士论文题目为“特定领域网页文本过滤技术研究”。毕业后返原单位工作。
柯武峰
2008年入学,研究方向为新词发现。2009年12月毕业,硕士论文题目为“基于Web的中英文术语自动抽取技术”。毕业后返原单位工作。
李军
硕士,2006年入学,研究方向为文本褒贬义分析。2008年12月毕业,硕士论文题目为“中文评论的褒贬义分类实验研究”。毕业后去Comodo公司工作。
孙帆
硕士,2006年毕业,硕士论文题目为“转导支持向量机方法研究及其在文本分类中的应用”,毕业后去美国University of Southern California深造。
张正操
硕士,2005年毕业,硕士论文题目为“基于内容的中文标题自动提取”。毕业后赴美国深造。
王洪涛
硕士,2004年毕业,硕士论文题目为“基于语义的信息检索研究初步”。目前担任当当网技术部搜索与数据挖掘总监。
许冬亮
硕士,2004年毕业,硕士论文题目为“汉语句子语义骨架的自动分析”,毕业后去百度公司工作。
罗霄
硕士,2003年毕业,硕士论文题目为“汉语自动分词中组合歧义消解与未登录词识别问题初探”。
奚晨海
硕士,2001年毕业。
肖云
硕士,2001年毕业,硕士题目为“汉语自动分词中组合型歧义消解策略初探”,毕业后去美国雅虎公司工作。
卢红娜
硕士,2000年毕业,硕士题目为“汉语文本检索中特征选择问题研究”。毕业后赴美国深造。现在纽约摩根士丹利(Morgan Stanley)工作。
曾经在本组的博士后
刘贤俊
2006年入站,2008年7月出站。出站后赴首都师范大学工作,2009年晋升为副教授。研究方向为现代汉语的语法与词汇。
薛宇飞
2013年入站,担任学堂在线科研工作,2015年7月出站。
汪华东
在站时间2018.11-2020.12(北京三星电子研究院与本系联合培养博后)、2021.6-2023.6,从事自然语言处理、知识图谱方向科研工作。
刘知远
2011年入站,2013年7月出站,任清华大学计算机系助理研究员。2017年晋升为副教授。
涂存超
2018年入站,2020年7月出站。创办幂律智能,任CEO。
冯聪
2021年1月入站,从事计算甲骨学方向研究工作,2023年7月出站。
曾经在本组进行学术访问的老师
吐尔根·依布拉音教授
新疆大学信息学院院长,曾于2008-2010年在本组学术访问。
阿迪拉老师
伊犁职业技术学院,曾于2009-2010年在本组学术访问。
巴吐尔·艾沙老师
新疆大学信息学院教师,曾于2006年在本组学术访问。
麦热哈巴.艾力老师
新疆大学信息学院副教授,曾于2010.9-2011.7在新疆自治区人社部“少数民族骨干特殊培养”计划的支持下在本组学术访问。
亚森·伊明老师
新疆维吾尔自治区民族语言文字工作委员会委员,曾于2008-2010年在本组学术访问。
赵晖老师
新疆大学信息学院软件工程系主任,曾于2009-2010年在本组学术访问。
麦麦提艾力.吐尔逊老师
新疆师范大学讲师,曾于2009.9-2011.7在新疆自治区人社部“少数民族骨干特殊培养”计划的支持下在本组学术访问。
于清老师
新疆大学信息学院副教授,曾于2011.10-2012.6在教育部“对口支援”计划的支持下在本组学术访问。