中文信息处理分工会组织秋游活动
天朗气清,金海赏秋 一年好景君须记,最是橙黄橘绿时,金海赏秋正当时。10月27日,中文信息处理实验室组织职工及学生20余人奔赴北京市金海湖,一赏秋日美景。 金海湖风景区,地处京城东北85公里京津唐交界的三角地带,三面环山,峰峦叠翠、风景秀丽,有千岛湖的湖观山色,又有兔耳岭的怪石嶙峋,有湖光塔、金花公主墓、望海亭、锯齿崖等自然景观、人文景观数十处。 金海湖水域宽阔、碧波万顷,是开展水上娱乐项目的理想之所。待到暖阳染红苍穹,湖面泛起点点金芒,荡起轻舸,泛舟湖上,微风吹皱粼粼涟漪,人在其中静静欣赏着青峰翠嶂,仿佛置身水墨山水之中,令人忘返。 [...]
中科院计算所冯洋副研究员应邀做学术报告
中科院计算所冯洋副研究员应邀做学术报告 2019年10月29日下午,应实验室孙乐研究员和韩先培研究员的邀请,中科院计算技术研究所冯洋副研究员到访实验室,为实验室师生做了题为“机器翻译的训练改进和解码提速”的学术报告。 冯老师的报告聚焦于机器翻译训练和测试阶段的四个困难,分别介绍了四个相对应的工作。首先,冯老师简要阐述了当前机器翻译使用的序列到序列模型架构:RnnSearch和Transformer,并指出在现有机器翻译模型训练阶段存在的:1)曝光偏差;2)词级匹配的问题以及测试阶段存在的:3)Beam Search搜索空间过大;4)顺序解码时效性差的问题。 曝光偏差是指机器翻译模型训练阶段将上一时刻准确的词作为输入以预测这一时刻的词,而测试阶段没有标准的目标端输出词只能将上一时刻预测的词作为输入。而这就导致了训练阶段与测试阶段的不一致。冯老师针对该问题介绍了他们在ACL2019的Best [...]
中科院软件所中文信息处理实验室招聘启事——特别研究助理(博士后) | 工程师
中国科学院软件研究所中文信息处理实验室招聘启事——特别研究助理(博士后) | 工程师 因科研工作需要,中国科学院软件研究所中文信息处理实验室现公开招聘以下岗位,即日起受理报名,竭诚欢迎符合条件的人士申请。 岗位一:特别研究助理/博士后(2-3人) [...]
中文信息处理实验室多名师生参加CCL2019
中文信息处理实验室多名师生参加CCL2019 “第十八届中国计算语言学大会”(The Eighteenth China National [...]
中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布
中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布 9月26日上午,由中国科学院软件研究所中文信息处理实验室负责研发的“北京冬奥项目知识图谱资源及问答系统”在北京语言大学正式发布。教育部、国家语委、北京冬奥组委、中国科学院软件研究所和北京语言大学相关领导及专家出席发布会。 会上,项目负责人、中国科学院软件研究所孙乐研究员详细介绍了“基于知识图谱的北京冬奥项目智能问答系统”的研发进展及成果特色。项目构建了大规模知识图谱,完整覆盖5类冬奥核心实体,设计多种类型的知识展示服务,研发了语音和文字两种输入方式的“智能问答平台”,提供实时便捷的冬奥会问答服务,为普及冬奥知识、宣传冬奥文化提供了全方位、立体化手段。 孙乐研究员介绍项目情况 中科院软件研究所副所长肖作敏研究员代表软件所发表致辞,首先感谢了教育部、国家语委和北京冬奥组委的指导,感谢项目合作单位北京语言大学的提供的大力支持。他表示,项目立项之初,软件所高度重视,深感在普及冬奥知识、宣扬冬奥文化方面的责任重大。未来将继续在人、财、物方面给予项目研发团队大力支持,持续钻研技术、锻造品牌,研发更多的智能语言服务成果,全力以赴地服务好北京冬奥会,共同谱写“智能”新篇章。 [...]
北京大学王选计算机研究所孙薇薇副教授应邀做学术报告
北京大学王选计算机研究所孙薇薇副教授应邀做学术报告 2019年9月17日下午,应实验室孙乐研究员和韩先培研究员邀请,北京大学王选计算机研究所孙薇薇副教授到访实验室,为实验室师生做了题为“English Resource Semantics: Linguistic [...]
中文信息处理实验室多名师生参加CCKS2019
中文信息处理实验室多名师生参加CCKS2019 2019年全国知识图谱与语义计算大会(China Conference on Knowledge [...]
中文信息处理实验室师生参加ACL2019
中文信息处理实验室师生参加ACL2019 ACL(Annual Meeting of the [...]
加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室
加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室 2019年6月24日上午,应实验室孙乐研究员的邀请,加拿大蒙特利尔大学聂建云教授以及江西师范大学的王明文教授与左家莉副教授访问实验室。 聂建云老师是加拿大蒙特利尔大学教授,他在自然语言处理和信息检索领域深耕多年,主要研究领域包括信息检索模型、跨语言信息检索、Query扩展、Query推荐、Query理解、查询日志利用、情感分析等等。聂建云教授在IR和NLP领域的期刊和国际会议上发表了200多篇论文,他是多个国际期刊的编委(e.g. Journal of [...]
微软亚洲研究院董力博士访问实验室
微软亚洲研究院董力博士访问实验室 2019年6月19日,应实验室孙乐研究员和韩先培研究员邀请,微软亚洲研究院董力博士到访实验室,为实验室师生员工带来了一场题为《UNILM: Unified Language Model [...]
清华大学黄民烈副教授应邀做学术报告
清华大学黄民烈副教授应邀做学术报告 2019年6月6日,应实验室孙乐研究员和韩先培研究员邀请,清华大学计算机系智能技术与系统实验室副主任黄民烈副教授到访实验室,为实验室师生员工带来了一场题为《Controllable text generation: types, [...]
自动化所曾祥荣博士应邀做学术报告
自动化所曾祥荣博士应邀做学术报告 2019年5月31日,应实验室孙乐研究员和韩先培研究员的邀请,中科院自动化所博士毕业生曾祥荣访问实验室,并做了一场题为“面向非结构化文本的关系抽取”的学术报告。 曾祥荣博士首先介绍了关系抽取任务的意义和任务分类,讲解了非结构化文本的关系抽取任务中的难点。随后介绍了在关系抽取任务上的三个工作:第一个工作介绍了如何使用强化学习的思想减轻关系抽取中远距离监督的噪音。第二个和第三个工作利用序列生成模型解决多关系抽取中的实体重叠问题。 报告结束后,曾祥荣博士同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。 [...]
祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生
祝贺实验室林鸿宇、陆垚杰、吴杉3位同学荣获软件所2019年度三好学生 根据《中国科学院大学“中国科学院院长奖”评审实施办法》和《中国科学院软件研究所优秀学生评选办法》,经个人申请,实验室培养小组初评和推荐,所评审小组评审,我实验室2017级博士林鸿宇、2018级博士陆垚杰和2017级硕士吴杉获得软件所2019年度“三好学生”荣誉称号。 [...]
实验室四项成果被自然语言处理顶级会议ACL 2019接收
实验室四项成果被自然语言处理顶级会议ACL 2019接收 ACL(Annual Meeting of [...]
天津大学张鹏副教授应邀做学术报告
天津大学张鹏副教授应邀做学术报告 2019年5月17日,应实验室孙乐研究员,韩先培研究员和何苯研究员的邀请,天津大学计算机系张鹏副教授访问实验室,并做了一场题为“A quantum many-body wave [...]
清华大学刘知远副教授应邀做学术报告
清华大学刘知远副教授应邀做学术报告 2019年4月19日,应实验室孙乐研究员和韩先培研究员的邀请,清华大学计算机系刘知远副教授访问实验室,并做了一场题为“知识指导的自然语言处理”的学术报告。 刘知远老师的报告首先概要介绍了自然语言的不同层次理解需要诸如语言知识、常识知识、世界知识等复杂知识的支撑,随后介绍了如何将知网 (Hownet)中的语言知识融入到语义分布式表示学习中;如何利用现有的大规模知识图谱进行知识表示学习,如何利用学习到的知识表示来指导现有的自然语言处理任务;以及如何利用深度学习技术进行知识获取的相关工作。 报告结束后,刘知远老师同与会的师生积极互动,解答大家的学术问题并进行了学术研究方法的交流,会场气氛热烈。 [...]
孙乐研究员参与翻译的《自然语言处理综论》出版
孙乐研究员参与翻译的《自然语言处理综论》出版 孙乐研究员与冯志伟教程合作翻译的《自然语言处理综论》第二版于2018年3月份正式出版。 从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: [...]
中文信息处理分工会组织春游活动
春意融融,长城怀古 阳春三月,草长莺飞,正是万物复苏的好时节。3月31日,中文信息处理实验室组织职工及学生40余人共同来到黄花城水长城景区,欣赏美景,放松心情。 黄花城水长城位于北京市怀柔区九渡河镇境内,因三段长城入水而得名,是北京唯一一处长城与水相连的长城。此处融青山、碧水、长城、古树为一体,有“塞外景,江南风,尽在水长城”的美誉。 拾级而上,水长城悠然而立,古朴自然。身处长城之上,漫山野桃花灿烂缤纷,灏明湖碧波粼粼,不时有小船掠过。大家通力合作,一起登上了长城的最高点,在这个过程中既感受到长城承载的厚重历史,也欣赏了自然的美丽风光。微风吹拂中,所有的疲惫都一扫而光。 除了雄伟的长城,归途上形态万千的板栗林,依山蜿蜒的盘山栈道,风景亦是美不胜收。在这样的美景中,大家心情愉悦,一路上欢声笑语,其乐融融。暮色四合,在农家小院的饭菜香味中,大家结束了一天的旅程。 [...]
北京大学冯岩松副教授应邀做学术报告
北京大学冯岩松副教授应邀做学术报告 2019年3月22日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,北京大学冯岩松副教授来访实验室,为大家带来一场题为“Combining Human Knowledge with [...]
新浪微博张俊林博士应邀来实验室做学术报告
新浪微博张俊林博士应邀来实验室做学术报告 2019年3月1日,应实验室主任孙乐研究员的邀请,新浪微博AI Lab资深算法专家张俊林博士来访实验室,为师生带来一场题为“自然语言预训练技术及RNN/CNN/Transformer比较”的精彩学术报告。现场座无虚席,反响热烈。 张俊林博士首先介绍了NLP中的一些主要预训练技术的技术演进历程,从基础的word embedding技术到近一年来兴起的ELMO、GPT、BERT等语言模型。这些预训练语言模型采用无监督的学习算法,得以利用大规模的自然语言语料进行训练,在各类自然语言处理任务上均取得巨大突破。而作为BERT基础组件的Transformer近年来也得到广泛应用,在各项任务中均取得不少进展。然后,张俊林博士对自然语言处理中的三大特征抽取器Transformer、RNN和CNN的各自优缺点进行了对比分析。最后,张俊林博士又同大家分享了自己对近些年预训练语言模型发展趋势的展望,并详细解答了同学们提出的相关问题。 [...]