Latest News 2019-06-21T08:57:18+00:00
1301, 2020

中文信息处理实验室学术指导委员会正式成立

中文信息处理实验室学术指导委员会正式成立 2020年1月12日,中国科学院软件研究所中文信息处理实验室学术指导委员会成立会议在北京成功召开。中国科学院软件研究所所长赵琛研究员致欢迎辞,并为学术指导委员会委员颁发聘书。实验室学术指导委员由三位专家组成:中国科学院计算技术研究所研究员、中国中文信息学会前理事长倪光南院士,中国电子信息产业集团有限公司首席科学家、中国中文信息学会理事长方滨兴院士,哈尔滨工业大学前党委书记、中国中文信息学会名誉理事长李生教授。 实验室主任孙乐研究员向各位专家汇报了实验室学术方向。孙乐研究员首先介绍了实验室目前的科研项目和人才团队,重点阐述了实验室围绕知识驱动的自然语言理解(K-NLU)这一学术方向,特别是在知识获取、知识融合及语义理解等方面面临的挑战和研究进展,最后就实验室发展向各位专家提出了一系列请教的问题。韩先培研究员演示了实验室研发的知识图谱资源、诗词平台和冬奥项目问答系统。 在听取了实验室学术方向汇报后,三位资深专家分别发言,从实验室学术方向规划、科研项目选择、人才队伍持续发展、成果落地及学生培养等多个方面对实验室工作进行了悉心指导,提出了许多宝贵意见和建议,为实验室今后发展指明了方向。     [...]

1301, 2020

南京理工大学夏睿教授应邀做学术报告

南京理工大学夏睿教授应邀做学术报告 2020年01月10日上午,应实验室孙乐研究员和韩先培研究员的邀请,南京理工大学计算机学院夏睿教授到访实验室,为实验室师生做了题为“文本情绪检测与原因抽取”的学术报告。 夏睿老师的报告聚焦于文本情绪分析研究中情绪原因抽取任务,其目标是抽取文本中某些情绪表达背后的潜在原因。学术界目前采用了包括规则方法,传统机器学习方法和深度神经网络在内的技术来解决这些任务。针对当前研究中存在的问题,夏睿老师首先介绍了两种新的情绪原因抽取模型,并在此基础上提出了一项新的任务——<情绪-原因>对抽取,进行同步的情绪预测与原因挖掘,在情绪原因分析基准语料库上的实验证明了任务的可行性和方法的有效性。 首先,夏睿老师简单为实验室的老师和同学们介绍了情绪原因抽取任务是一个子句级的分类任务,并通过一个简单易懂的例子为大家说明了现有方法存在的问题:没有充分考虑情绪原因在文档中的分布规律。通过对数据的仔细分析以及任务的深入理解,夏睿老师的团队提出:1)子句与情感描述句的相对位置是一个很强的先验知识,离情感描述句越近的子句包含情感原因的概率越高;2)在一篇短文档中,情感原因往往只有1个或者两个。根据以上发现,夏老师为实验室师生介绍了他们发表在AAAI2019和IJCAI2019的两篇工作:From Independent Prediction [...]

2512, 2019

大阪大学褚晨翚博士应邀做学术报告

大阪大学褚晨翚博士应邀做学术报告 2019年12月24日下午,应实验室孙乐研究员和韩先培研究员邀请,大阪大学褚晨翚博士到访实验室,为实验室师生作了题为“从多语言到多模态处理”的学术报告。 褚晨翚博士的报告主要聚焦于近年来极为热门的跨语言及跨模态相关的研究。在报告中,褚博士主要介绍了其课题组近期发表在顶级刊物上的三个科研成果,内容涉及多语言机器翻译、视觉问答复述以及基于知识的视觉问答等重要方向。 在多语言机器翻译上,褚博士提出了一种全新的三步骤微调学习方案,大幅度地提升了多语言机器翻译模型的性能。 在视觉问答复述上,褚博士的课题组率先提出了在视觉问答中需要考虑训练以及测试中的复述现象,提出了一个全新的视觉复述识别任务,并对该任务进行了系统性的研究。 在基于知识的视觉问答上,褚博士的课题组构造了一个全新的视觉问答数据,该数据需要综合各种不同的背景知识进行推理,从而能够很好地衡量模型基于知识推理的能力。 [...]

1212, 2019

浙江大学丁鼐研究员应邀做学术报告

浙江大学丁鼐研究员应邀做学术报告 2019年12月12日下午,应实验室孙乐研究员和韩先培研究员邀请,浙江大学生物医学工程与仪器科学学院丁鼐研究员,为实验室师生作了题为“层级语言结构的认知神经加工”的学术报告。 丁鼐老师首先通过一系列实验向大家介绍了大脑如何编码语音中不同层级的语言单元——比如音节、词、短语和语句。这些实验主要建模语言特征与脑信号之间的关系,实验结果显示不同时间尺度的神经振荡表征不同大小的语言单元,这也说明了大脑构建了多层级的语言表征。 随后丁鼐老师介绍了注意力如何影响大脑对不同大小语言单元的编码。实验发现高级语言结构加工更依赖于注意力,而且句子聆听过程中的注意焦点可以调节大脑响应。 报告结束后,实验室老师和多位同学与丁鼐老师针对人与计算机进行阅读理解时注意力的差异、大脑中词汇表征形式等问题进行了深入交流。 责任编辑:马龙龙 [...]

212, 2019

阿里达摩院陈博兴博士应邀做学术报告

阿里达摩院陈博兴博士应邀做学术报告 2019年11月29日下午,应实验室孙乐研究员和韩先培研究员邀请,阿里巴巴达摩院机器智能技术实验室陈博兴博士到访实验室,为实验室师生作了题为“语音翻译的技术及其应用”的学术报告。 陈老师的报告主要介绍了阿里巴巴集团近年来在语音翻译方面的相关工作。从主要挑战、技术策略以及实际应用等多个方面介绍了阿里巴巴公司在语音翻译方面的研究及落地情况。 首先,陈老师简单回顾了在语音翻译方面的两个主要的技术路线:级联式以及端到端的方法。虽然近年来端到端的方法得到的广泛的关注,但因其对于数据量的要求较高,阿里巴巴公司目前仍然采用级联式的语音翻译方案。 接下来,陈老师总结了在级联式语音翻译中的主要挑战:糟糕的翻译输入(主要来自于语音错误、断句错误、不通顺、非正式语言),缺少相关的标注语料(缺少非正式语言的平行语料等)以及在MT任务上的一些传统挑战。 针对上述的一些重要挑战,陈老师分别详细地介绍了阿里巴巴公司在级联式方法的翻译输入以及翻译过程上的一些相关工作。 [...]

1811, 2019

复旦大学张奇教授应邀做学术报告

复旦大学张奇教授应邀做学术报告 2019年11月18日下午,应实验室孙乐研究员和韩先培研究员邀请,复旦大学计算机学院张奇教授到访实验室,为实验室师生作了题为“搜索引擎中的智能问答”的学术报告。 张老师的报告聚焦于近些年在学术界和工业界都备受关注的智能问答方向。张老师首先介绍了近些年搜索引擎发展的趋势,指出了智能问答技术在移动互联网时代的重要性。随即,张老师比较了近些年在学术界火热的SQuAD数据集和工业界实际应用场景下的区别,相比于SQuAD评测,工业界实际场景中存在文档种类更多,质量差异大,文档更长,且不一定存在正确答案等问题,使得真实场景中的智能问答难度更大,更具挑战性。 为了解决智能问答中存在的这些问题,张老师将解决方案分为三大类:1)基于社区的问题回答;2)基于知识图谱的问题回答;3)机器阅读理解。张老师着重介绍了第一和第三这两大类方案的主要方法和最新工作。 基于社区的问题回答,可以当成语义匹配问题来建模。现阶段互联网的问答平台如百度知道、搜狗问问、知乎等都已积累了丰富的问题和答案资源。当用户有新的问题咨询时,可以直接在已有问题中匹配到相似问题,返回对应的已有答案。现有的语义匹配模型可以分为两大类:一是基于句子表示的方法;二是基于交互关系的方法。 在实际问答场景中,许多问题所包含信息较少,但其对应答案中却包含可以解释和区分问题的信息。因此,张老师等在SIGIR2019发表的工作利用自适应多注意力机制,融合答案和问题信息,提高了语义匹配的性能。 [...]

811, 2019

祝贺实验室唐家龙和吴杉荣获2019年国家奖学金

祝贺实验室唐家龙和吴杉荣获2019年国家奖学金 所研究生国家奖学金评审委员会于2019年11月6日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2018级直博生唐家龙同学、2017级硕士吴杉同学获得2019年硕士研究生国家奖学金。特向两位同学表示祝贺!      

2910, 2019

中科院计算所冯洋副研究员应邀做学术报告

中科院计算所冯洋副研究员应邀做学术报告 2019年10月29日下午,应实验室孙乐研究员和韩先培研究员的邀请,中科院计算技术研究所冯洋副研究员到访实验室,为实验室师生做了题为“机器翻译的训练改进和解码提速”的学术报告。 冯老师的报告聚焦于机器翻译训练和测试阶段的四个困难,分别介绍了四个相对应的工作。首先,冯老师简要阐述了当前机器翻译使用的序列到序列模型架构:RnnSearch和Transformer,并指出在现有机器翻译模型训练阶段存在的:1)曝光偏差;2)词级匹配的问题以及测试阶段存在的:3)Beam Search搜索空间过大;4)顺序解码时效性差的问题。 曝光偏差是指机器翻译模型训练阶段将上一时刻准确的词作为输入以预测这一时刻的词,而测试阶段没有标准的目标端输出词只能将上一时刻预测的词作为输入。而这就导致了训练阶段与测试阶段的不一致。冯老师针对该问题介绍了他们在ACL2019的Best Long [...]

2910, 2019

中文信息处理分工会组织秋游活动

天朗气清,金海赏秋 一年好景君须记,最是橙黄橘绿时,金海赏秋正当时。10月27日,中文信息处理实验室组织职工及学生20余人奔赴北京市金海湖,一赏秋日美景。 金海湖风景区,地处京城东北85公里京津唐交界的三角地带,三面环山,峰峦叠翠、风景秀丽,有千岛湖的湖观山色,又有兔耳岭的怪石嶙峋,有湖光塔、金花公主墓、望海亭、锯齿崖等自然景观、人文景观数十处。 金海湖水域宽阔、碧波万顷,是开展水上娱乐项目的理想之所。待到暖阳染红苍穹,湖面泛起点点金芒,荡起轻舸,泛舟湖上,微风吹皱粼粼涟漪,人在其中静静欣赏着青峰翠嶂,仿佛置身水墨山水之中,令人忘返。   告别秋水盈盈的金海湖,大家来到了苹果采摘园体验采收。晚秋的时节,带着丝丝凉意,大家健步快走、气氛热烈融洽,零距离感受田园风光,体验亲手采摘的超凡乐趣。 [...]

2709, 2019

中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布

中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布 9月26日上午,由中国科学院软件研究所中文信息处理实验室负责研发的“北京冬奥项目知识图谱资源及问答系统”在北京语言大学正式发布。教育部、国家语委、北京冬奥组委、中国科学院软件研究所和北京语言大学相关领导及专家出席发布会。 会上,项目负责人、中国科学院软件研究所孙乐研究员详细介绍了“基于知识图谱的北京冬奥项目智能问答系统”的研发进展及成果特色。项目构建了大规模知识图谱,完整覆盖5类冬奥核心实体,设计多种类型的知识展示服务,研发了语音和文字两种输入方式的“智能问答平台”,提供实时便捷的冬奥会问答服务,为普及冬奥知识、宣传冬奥文化提供了全方位、立体化手段。 孙乐研究员介绍项目情况 中科院软件研究所副所长肖作敏研究员代表软件所发表致辞,首先感谢了教育部、国家语委和北京冬奥组委的指导,感谢项目合作单位北京语言大学的提供的大力支持。他表示,项目立项之初,软件所高度重视,深感在普及冬奥知识、宣扬冬奥文化方面的责任重大。未来将继续在人、财、物方面给予项目研发团队大力支持,持续钻研技术、锻造品牌,研发更多的智能语言服务成果,全力以赴地服务好北京冬奥会,共同谱写“智能”新篇章。 肖作敏副所长致辞 [...]

2207, 2019

军事科学院罗准辰博士应邀做学术报告

军事科学院罗准辰博士应邀做学术报告 2019年7月19日,应实验室孙乐研究员和韩先培研究员的邀请,军事科学院军事科学信息研究中心罗准辰博士访问实验室,做了题为“技术预见中的感知,认知,论知”的学术报告。 罗准辰,博士毕业于国防科学技术大学计算机学院,曾分别在英国爱丁堡大学和海南文昌卫星发射中心有学习和工作经历,长期从事自然语言处理和国防科技信息大数据研究与论证工作,参与主持多项国家项目,发表论文50余篇,获国家发明专利5项,并多次担任人工智能顶级会议程序委员会委员。曾获军队科学技术进步二等奖(排名第3),国防科学技术大学“慈云桂计算机奖”,全军优秀技术人才三类岗位津贴。 罗准辰博士的学术报告围绕“技术预见”的主题,重点分享了三个阶段的“技术预见”方法:“感知,认知和论知”。报告首先从美国DARPA和IARPA项目开始介绍,结合我国的现状,并亲切地以研究生选题为例生动说明了“技术预见”的重要性。“技术预见”被称为“科学的科学”,主要研究科学活动本身的规律。它分析当下科学研究的最新进展,辅助人们预测并制定下一步科学研究活动。 学术报告后,罗准辰博士和实验室的师生开展了热烈的讨论,回答师生提出的问题。该报告受到师生的热烈欢迎,圆满结束。 责任编辑:马龙龙 [...]

2506, 2019

加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室

加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室 2019年6月24日上午,应实验室孙乐研究员的邀请,加拿大蒙特利尔大学聂建云教授以及江西师范大学的王明文教授与左家莉副教授访问实验室。 聂建云老师是加拿大蒙特利尔大学教授,他在自然语言处理和信息检索领域深耕多年,主要研究领域包括信息检索模型、跨语言信息检索、Query扩展、Query推荐、Query理解、查询日志利用、情感分析等等。聂建云教授在IR和NLP领域的期刊和国际会议上发表了200多篇论文,他是多个国际期刊的编委(e.g. Journal of information [...]

1906, 2019

微软亚洲研究院董力博士访问实验室

微软亚洲研究院董力博士访问实验室 2019年6月19日,应实验室孙乐研究员和韩先培研究员邀请,微软亚洲研究院董力博士到访实验室,为实验室师生员工带来了一场题为《UNILM: Unified Language Model Pre-Training [...]

706, 2019

清华大学黄民烈副教授应邀做学术报告

清华大学黄民烈副教授应邀做学术报告 2019年6月6日,应实验室孙乐研究员和韩先培研究员邀请,清华大学计算机系智能技术与系统实验室副主任黄民烈副教授到访实验室,为实验室师生员工带来了一场题为《Controllable text generation: types, knowledge, [...]

106, 2019

自动化所曾祥荣博士应邀做学术报告

自动化所曾祥荣博士应邀做学术报告 2019年5月31日,应实验室孙乐研究员和韩先培研究员的邀请,中科院自动化所博士毕业生曾祥荣访问实验室,并做了一场题为“面向非结构化文本的关系抽取”的学术报告。 曾祥荣博士首先介绍了关系抽取任务的意义和任务分类,讲解了非结构化文本的关系抽取任务中的难点。随后介绍了在关系抽取任务上的三个工作:第一个工作介绍了如何使用强化学习的思想减轻关系抽取中远距离监督的噪音。第二个和第三个工作利用序列生成模型解决多关系抽取中的实体重叠问题。 报告结束后,曾祥荣博士同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。    

2305, 2019

祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生

祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生 根据《中国科学院大学“中国科学院院长奖”评审实施办法》和《中国科学院软件研究所优秀学生评选办法》,经个人申请,实验室培养小组初评和推荐,所评审小组评审,我实验室2017级博士林鸿宇、2018级博士陆垚杰和2017级硕士吴杉获得软件所2019年度“三好学生”荣誉称号。         [...]

1805, 2019

天津大学张鹏副教授应邀做学术报告

天津大学张鹏副教授应邀做学术报告 2019年5月17日,应实验室孙乐研究员,韩先培研究员和何苯研究员的邀请,天津大学计算机系张鹏副教授访问实验室,并做了一场题为“A quantum many-body wave function [...]

2304, 2019

清华大学刘知远副教授应邀做学术报告

清华大学刘知远副教授应邀做学术报告 2019年4月19日,应实验室孙乐研究员和韩先培研究员的邀请,清华大学计算机系刘知远副教授访问实验室,并做了一场题为“知识指导的自然语言处理”的学术报告。 刘知远老师的报告首先概要介绍了自然语言的不同层次理解需要诸如语言知识、常识知识、世界知识等复杂知识的支撑,随后介绍了如何将知网 (Hownet)中的语言知识融入到语义分布式表示学习中;如何利用现有的大规模知识图谱进行知识表示学习,如何利用学习到的知识表示来指导现有的自然语言处理任务;以及如何利用深度学习技术进行知识获取的相关工作。 报告结束后,刘知远老师同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。  

104, 2019

中文信息处理分工会组织春游活动

春意融融,长城怀古 阳春三月,草长莺飞,正是万物复苏的好时节。3月31日,中文信息处理实验室组织职工及学生40余人共同来到黄花城水长城景区,欣赏美景,放松心情。 黄花城水长城位于北京市怀柔区九渡河镇境内,因三段长城入水而得名,是北京唯一一处长城与水相连的长城。此处融青山、碧水、长城、古树为一体,有“塞外景,江南风,尽在水长城”的美誉。 拾级而上,水长城悠然而立,古朴自然。身处长城之上,漫山野桃花灿烂缤纷,灏明湖碧波粼粼,不时有小船掠过。大家通力合作,一起登上了长城的最高点,在这个过程中既感受到长城承载的厚重历史,也欣赏了自然的美丽风光。微风吹拂中,所有的疲惫都一扫而光。 除了雄伟的长城,归途上形态万千的板栗林,依山蜿蜒的盘山栈道,风景亦是美不胜收。在这样的美景中,大家心情愉悦,一路上欢声笑语,其乐融融。暮色四合,在农家小院的饭菜香味中,大家结束了一天的旅程。 欢乐不觉时光过。通过此次活动,大家放松心情,也将春天的生机与活力带回了实验室中。作为一个团体,中文信息处理实验室将继续奋进,一同前行! [...]

2503, 2019

北京大学冯岩松副教授应邀做学术报告

北京大学冯岩松副教授应邀做学术报告 2019年3月22日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,北京大学冯岩松副教授来访实验室,为大家带来一场题为“Combining Human Knowledge with Neural [...]

403, 2019

新浪微博张俊林博士应邀来实验室做学术报告

新浪微博张俊林博士应邀来实验室做学术报告 2019年3月1日,应实验室主任孙乐研究员的邀请,新浪微博AI Lab资深算法专家张俊林博士来访实验室,为师生带来一场题为“自然语言预训练技术及RNN/CNN/Transformer比较”的精彩学术报告。现场座无虚席,反响热烈。 张俊林博士首先介绍了NLP中的一些主要预训练技术的技术演进历程,从基础的word embedding技术到近一年来兴起的ELMO、GPT、BERT等语言模型。这些预训练语言模型采用无监督的学习算法,得以利用大规模的自然语言语料进行训练,在各类自然语言处理任务上均取得巨大突破。而作为BERT基础组件的Transformer近年来也得到广泛应用,在各项任务中均取得不少进展。然后,张俊林博士对自然语言处理中的三大特征抽取器Transformer、RNN和CNN的各自优缺点进行了对比分析。最后,张俊林博士又同大家分享了自己对近些年预训练语言模型发展趋势的展望,并详细解答了同学们提出的相关问题。  

203, 2019

中国科学院自动化研究所刘康副研究员应邀做学术报告

中国科学院自动化研究所刘康副研究员应邀做学术报告 2019年1月11日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,中国科学院自动化研究所刘康副研究员走进中文信息处理实验室,为实验室师生做了关于事件抽取的学术讲座。 刘康博士结合课题组近年来的工作进展, 向大家介绍了从非结构化文本中抽取结构化事件知识的基本方法, 以及应对开放域事件抽取标记数据稀缺的新思路。此外,刘康博士还和大家分享了深度学习方法在金融事件抽取应用项目中的经验和体会。 报告结束后,刘康老师与参会的师生进行互动,探讨了金融事件抽取相关的若干问题,现场气氛活跃。

103, 2019

复旦大学邱锡鹏老师访问实验室

复旦大学邱锡鹏老师访问实验室 2018年11月9日,应实验室韩先培研究员邀请,复旦大学计算机科学技术学院邱锡鹏老师走进中文信息处理实验室,为师生带来精彩学术报告,中科院软件所和自动化所的同学前来听讲座,现场座无虚席,反响热烈。 邱锡鹏老师以“如何端到端地写科研论文”为题,介绍了如何做科研和写出好的科研论文。老师先讲解了几大顶会的评审制度和审稿标准,然后又从同行评议的数据集出发,通过几种可解释性强的模型,分析了对于论文录用概率有影响的不同的写作方法和写作细节。邱老师又以自己组内ACL-2017的文章《Adversarial Multi-Criteria Learning for [...]

2512, 2018

2018年实验室代表性论文介绍

2018年实验室代表性论文介绍 一、基于区块提议网络的中文事件检测 事件检测则是事件抽取中的一个关键步骤。近年来,随着基于神经网络方法的发展,人们常常将事件检测转化为一个词级别的分类问题来对待。然而,基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中,有许多的事件触发词块并不是一个特定的词。 针对上述问题,我们提出了一种基于区块提议网络的中文事件检测方法。具体地,我们的方法首先使用动态多池化卷积神经网络抽取字符级别和词级别的混合特征。之后基于混合特征的触发词块生成器可以在字符级别上直接给出整个触发词块的检测结果,从而避免了事件触发词块与词的不匹配问题。实验结果表明我们的方法在事件检测标准数据集TAC-KBP2017以及ACE2005上取得了State-of-the-Art性能。 上述成果长文发表在自然语言处理顶级国际会议ACL 2018会议上: [...]

1610, 2018

祝贺实验室林鸿宇和陆垚杰荣获2018年国家奖学金

祝贺实验室林鸿宇和陆垚杰荣获2018年国家奖学金 所研究生国家奖学金评审委员会于2018年10月15日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2017级博士林鸿宇同学、2016级硕士陆垚杰同学获得2018年研究生国家奖学金。值得一提的是,这是林鸿宇同学连续第2年获得博士国家奖学金。向两位同学表示祝贺!

907, 2018

祝贺实验室林鸿宇、陆垚杰、刘方超3位同学荣获2017-2018学年优秀学生

祝贺实验室林鸿宇、陆垚杰、刘方超3位同学荣获2017-2018学年优秀学生 根据《中国科学院软件研究所优秀学生评选办法》,经所评审小组评审,我实验室2017级博士林鸿宇同学获得“三好标兵”荣誉称号,2018级博士陆垚杰和刘方超同学获得2017-2018“三好学生”荣誉称号。

507, 2018

Four long papers were accepted by ACL2018

本研究室的四篇长文工作被国际顶级会议ACL2018会议录用 本研究室四篇长文被计算语言学领域顶级会议ACL2018录用,涉及的领域包括语义解析、事件抽取、论文自动评分等。 (1)Sequence-to-Action: End-to-End Semantic [...]

2706, 2018

祝贺实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号

祝贺实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号 陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号. 软件所今年共有毕业生100名,其中博士生27名,硕士生73名。 经软件所学术委员会评定,评选5名优秀博士毕业生和1名优秀硕士毕业生。 我实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号。  

1606, 2018

实验室安波参加NAACL2018国际会议

实验室安波参加NAACL2018国际会议 本次参加NAACL2018国际会议有一篇长文被会议录用,论文内容是关于使用文本信息来增强知识图谱的表示,应用场景包括知识图谱的推理和补全。本文在主会场进行了海报展示,并与参会的其他研究人员进行深入的讨论,对宣传自己的工作未来工作都有很好的作用。 本次参会参加了两个tutorial,主要是知识图谱的构建和推理、基于深度学习的对话系统。更系统的学习了从信息抽取、知识图谱构建和知识图谱的表示和推理的内容,尤其是参会人员一起讨论了知识图谱的未来方向,对下一步的研究具有很好的指导价值。另外一个基于深度学习的对话系统则全面而深入的了解了对话系统这个方向的主要挑战、研究热点和目前的研究状态。以及如何从业务出发搭建一个基本的对话系统。   该会议的主会议有3天,内容涉及了计算语言学的各个主要研究方向。包括信息抽取、知识表示、深度学习在NLP的应用、问答系统、对话系统等等,具有很高的学习价值。 会议还要请了5个keynote,部分来自学届、部分来自工业界。其中关于认知的研究为计算语言学未来的发展提供了一定的启示作用。对于训练数据的多少也有很深入的讨论。 [...]

2504, 2018

实验室参加阿里“藏经阁”知识引擎计划

     实验室参加阿里“藏经阁”知识引擎计划 4月21日上午,阿里巴巴联合中科院软件所、清华大学、浙江大学、中国科学院自动化所、苏州大学5所高校发布藏经阁(知识引擎)研究计划。 该计划以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网信息内容表达成更接近人类认知世界的形式,从而使计算机具备类脑推理能力。 同时,阿里还宣布打算用一年时间初步建成首个开放的知识引擎服务平台,服务中小企业。 [...]

1504, 2018

孙乐研究员参与翻译的《自然语言处理综论》出版

     孙乐研究员参与翻译的《自然语言处理综论》出版 孙乐研究员与冯志伟教程合作翻译的《自然语言处理综论》第二版于2018年3月份正式出版。 从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 [...]

904, 2018

祝贺实验室林鸿宇博士和刘泽宇硕士荣获2017年国家奖学金

祝贺实验室林鸿宇博士和刘泽宇硕士荣获2017年国家奖学金 所研究生国家奖学金评审委员会于2017年10月16日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2017级博士林鸿宇同学、2005级硕士刘泽宇同学获得2017年研究生国家奖学金。

1501, 2018

自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会在软件所顺利召开

自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会在软件所顺利召开 8月16日,为了促进国内自然语言处理相关研究的发展以及研究者之间的交流,由中国中文信息学会青年工作委员会主办,搜狗公司承办的 “自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会”在中国科学院软件研究所成功举办。来自中科院、北京大学、清华大学、复旦大学、哈工大、澳门大学等境内外高校和搜狗、百度、阿里等企业的科研人员和研究生200余人参加了本次研讨会和论文报告会。 本次会议由中国中文信息学会青年工作委员会执委、中科院软件所韩先培副研究员主持。中国中文信息学会副理事长及秘书长中科院软件所孙乐研究员,青工委主任清华大学刘洋副教授,搜狗公司搜索事业部许静芳总经理出席会议。中国中文信息学会青年工作委员会主任刘洋、搜狗搜索事业部总经理许静芳分别代表主办方和承办方致欢迎辞。 EMNLP是自然语言处理的顶级学术会议,2017年年会将于9月6日至12日在丹麦哥本哈根举行。本次论文报告会从国内被录用的近40篇长文中邀请了18篇论文作者进行提前报告,他们分别来自中科院、北京大学、清华大学、复旦大学、哈工大、澳门大学、哈工大深圳研究生院、南京大学、人民大学、东北大学、南京理工大学、黑龙江大学等多个高校。报告人深入介绍了各自在文本摘要、情感分析、机器翻译、信息抽取、自动问答、表示学习等多个领域的最新研究成果。会议实况经搜狐千帆直播平台向全网直播,4000多人观看了网络直播,众多网友和现场参会者线上线下联动,新的观点和灵感不断被激发、碰撞,会场气氛热烈。   [...]

1512, 2017

韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖

韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖 2016年12月23日,中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在北京隆重举行,会上颁发了“钱伟长中文信息处理科学技术奖”、中国中文信息学会“终身成就奖”、“汉王青年创新奖”以及中国中文信息学会优秀博士学位论文“拓尔思优秀博士学位论文奖”。软件所中文信息处理研究室韩先培副研究员获得“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。 韩先培多年来一直致力于自然语言理解和知识图谱相关的研究工作。自然语言理解是人工智能和自然语言处理的核心科学问题,在研究和应用领域都具有重要的作用。围绕自然语言理解,韩先培在开放域语义知识获取和知识驱动文本语义分析方面取得了多项研究成果。在国际顶级学术会议如ACL、SIGIR、AAAI、EMNLP、CIKM上发表重要论文30余篇,其中在自然语言处理顶级会议ACL上发表论文7篇,相关系统在国际权威评测SIGHAN 2012中文实体链接任务取得第一名的成绩。 韩先培的论文被同行广泛引用,其论文共获得国内外700余次引用,其中引用数超过100次的论文有三篇。特别是,SIGIR 2011论文在五年内被引用216次,在信息检索领域顶级学术会议SIGIR 近五年来发表的493篇论文中排在第2位,同时Google [...]

907, 2017

实验室参与编写《中文信息处理发展报告2016》

实验室参与编写《中文信息处理发展报告2016》 介绍了中文信息处理的各种技术研究进展呢,阅读本文有利于了解信息处理发展现状,确定自己的研究方向。 内容涵盖: 一、词法、句法、文法等 发展趋势: 1) [...]

Contact Info

4# South Fourth Street, Zhong Guan Cun, Beijing 100190

Phone: 86-10-62661012, 62661013

Fax: 86-10-62562533

Web: ThemeFusion

Recent Posts