未分类

/未分类

中科院计算所冯洋副研究员应邀做学术报告

2019-10-29T17:34:55+00:00

中科院计算所冯洋副研究员应邀做学术报告 2019年10月29日下午,应实验室孙乐研究员和韩先培研究员的邀请,中科院计算技术研究所冯洋副研究员到访实验室,为实验室师生做了题为“机器翻译的训练改进和解码提速”的学术报告。 冯老师的报告聚焦于机器翻译训练和测试阶段的四个困难,分别介绍了四个相对应的工作。首先,冯老师简要阐述了当前机器翻译使用的序列到序列模型架构:RnnSearch和Transformer,并指出在现有机器翻译模型训练阶段存在的:1)曝光偏差;2)词级匹配的问题以及测试阶段存在的:3)Beam Search搜索空间过大;4)顺序解码时效性差的问题。 曝光偏差是指机器翻译模型训练阶段将上一时刻准确的词作为输入以预测这一时刻的词,而测试阶段没有标准的目标端输出词只能将上一时刻预测的词作为输入。而这就导致了训练阶段与测试阶段的不一致。冯老师针对该问题介绍了他们在ACL2019的Best Long Paper:Bridging the Gap between [...]

中科院计算所冯洋副研究员应邀做学术报告 2019-10-29T17:34:55+00:00

中科院软件所中文信息处理实验室招聘启事——特别研究助理(博士后) | 工程师

2019-10-29T09:47:45+00:00

中国科学院软件研究所中文信息处理实验室招聘启事——特别研究助理(博士后) | 工程师 因科研工作需要,中国科学院软件研究所中文信息处理实验室现公开招聘以下岗位,即日起受理报名,竭诚欢迎符合条件的人士申请。 岗位一:特别研究助理/博士后(2-3人) 任职描述: 从事自然语言处理方向的研究; 与实验室主任协商确定研究方向和任务,深入开展研究工作; 积极申报国家级科研项目; 聘期内发表高水平期刊或会议论文2篇以上(CCF-A类或CCF-B类); [...]

中科院软件所中文信息处理实验室招聘启事——特别研究助理(博士后) | 工程师 2019-10-29T09:47:45+00:00

中文信息处理实验室多名师生参加CCL2019

2019-10-28T19:02:00+00:00

中文信息处理实验室多名师生参加CCL2019 “第十八届中国计算语言学大会”(The Eighteenth China National Conference on Computational Linguistics, CCL [...]

中文信息处理实验室多名师生参加CCL2019 2019-10-28T19:02:00+00:00

中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布

2019-09-27T18:00:19+00:00

中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布 9月26日上午,由中国科学院软件研究所中文信息处理实验室负责研发的“北京冬奥项目知识图谱资源及问答系统”在北京语言大学正式发布。教育部、国家语委、北京冬奥组委、中国科学院软件研究所和北京语言大学相关领导及专家出席发布会。 会上,项目负责人、中国科学院软件研究所孙乐研究员详细介绍了“基于知识图谱的北京冬奥项目智能问答系统”的研发进展及成果特色。项目构建了大规模知识图谱,完整覆盖5类冬奥核心实体,设计多种类型的知识展示服务,研发了语音和文字两种输入方式的“智能问答平台”,提供实时便捷的冬奥会问答服务,为普及冬奥知识、宣传冬奥文化提供了全方位、立体化手段。 孙乐研究员介绍项目情况 中科院软件研究所副所长肖作敏研究员代表软件所发表致辞,首先感谢了教育部、国家语委和北京冬奥组委的指导,感谢项目合作单位北京语言大学的提供的大力支持。他表示,项目立项之初,软件所高度重视,深感在普及冬奥知识、宣扬冬奥文化方面的责任重大。未来将继续在人、财、物方面给予项目研发团队大力支持,持续钻研技术、锻造品牌,研发更多的智能语言服务成果,全力以赴地服务好北京冬奥会,共同谱写“智能”新篇章。 肖作敏副所长致辞 北京语言大学副校长张旺喜教授在致辞中表示,冬奥项目知识图谱资源及问答系统特色鲜明、优势突出,期待项目再上一个更高的台阶。北京语言大学将继续与中科院软件研究所密切合作,为冬奥会提供精益求精、臻于极致的服务。 教育部语信司副司长刘宏致辞。他首先充分肯定了项目成果,该项目丰富并完善了冬奥知识问答服务,本次发布的“北京冬奥项目知识图谱资源及问答系统”,是落实2017年《北京冬奥会语言服务行动计划》的又一重要体现。他认为,要继续加强多方合作,在体制机制方面进行大胆探讨与创新,各相关部门要继续发挥应有职能,切实为2022年北京冬奥会创造良好环境,彰显中国语言的独特魅力。 北京冬奥组委对外联络部副部长万学军在致辞中表示,冬奥组委高度重视科技和人工智能,今天的项目成果发布会适逢其时,“人类与计算机对话服务”将为北京冬奥会提供更加丰富的手段,提供更加多元的智慧,为世界奉上一届精彩、非凡、卓越的体育盛会。 启动仪式开始。与会领导及专家在倒计时主屏幕前,共同启动了“北京冬奥项目知识图谱资源”及“小奥智能问答系统”,国家语委、教育部语信司副司长刘宏宣布:“北京冬奥项目问答系统正式上线”。全场观众见证了这一重要时刻。 [...]

中文信息处理实验室研发的“北京冬奥项目知识图谱资源及问答系统”正式发布 2019-09-27T18:00:19+00:00

北京大学王选计算机研究所孙薇薇副教授应邀做学术报告

2019-09-18T08:56:57+00:00

北京大学王选计算机研究所孙薇薇副教授应邀做学术报告 2019年9月17日下午,应实验室孙乐研究员和韩先培研究员邀请,北京大学王选计算机研究所孙薇薇副教授到访实验室,为实验室师生做了题为“English Resource Semantics: Linguistic Design and Neural Parsing”的学术报告。 孙老师的报告是关于图表征的句子的语义表示和处理,报告主要分为四个部分。首先,孙老师简要阐述了自然语言表义的几个主要方面,分别是:predicate-argument [...]

北京大学王选计算机研究所孙薇薇副教授应邀做学术报告 2019-09-18T08:56:57+00:00

中文信息处理实验室多名师生参加CCKS2019

2019-08-30T10:02:23+00:00

中文信息处理实验室多名师生参加CCKS2019 2019年全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing, 2019)于8月24日至27日在杭州召开,由中国中文信息学会语言与知识计算专业委员会主办,浙江大学承办。大会吸引了来自海内外的八百多名科研学者、工业界专家和知名企业代表参加。实验室师生代表参加了CCKS [...]

中文信息处理实验室多名师生参加CCKS2019 2019-08-30T10:02:23+00:00

中文信息处理实验室师生参加ACL2019

2019-08-15T13:33:21+00:00

中文信息处理实验室师生参加ACL2019 ACL(Annual Meeting of the Association for Computational Linguistics)是自然语言处理领域的顶级国际会议,覆盖了语言分析、信息抽取、信息检索、自动问答、情感分析和观点挖掘、文摘和文本生成、文本分类和挖掘、机器翻译、口语处理等众多研究方向。ACL被中国计算机学会推荐国际学术会议列表认定为A类会议。 ACL2019于7月27日-8月2日在意大利佛罗伦萨召开。本次会议参会人数超过了3000人。中文信息处理实验室孙乐研究员、韩先培研究员以及博士生林鸿宇、陆垚杰、唐家龙参加了本次会议。 [...]

中文信息处理实验室师生参加ACL2019 2019-08-15T13:33:21+00:00

加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室

2019-06-26T08:13:57+00:00

加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室 2019年6月24日上午,应实验室孙乐研究员的邀请,加拿大蒙特利尔大学聂建云教授以及江西师范大学的王明文教授与左家莉副教授访问实验室。 聂建云老师是加拿大蒙特利尔大学教授,他在自然语言处理和信息检索领域深耕多年,主要研究领域包括信息检索模型、跨语言信息检索、Query扩展、Query推荐、Query理解、查询日志利用、情感分析等等。聂建云教授在IR和NLP领域的期刊和国际会议上发表了200多篇论文,他是多个国际期刊的编委(e.g. Journal of information retrieval),并作为程序委员会成员参与了IR和NLP领域的很多国际会议主会的组织工作。他是SIGIR 2011的大会主席,是SIGIR 2019的程序委员会主席。 聂建云教授跟大家分享了其研究团队即将在第42届ACM [...]

加拿大蒙特利尔大学聂建云教授、江西师范大学王明文教授与左家莉副教授访问实验室 2019-06-26T08:13:57+00:00

微软亚洲研究院董力博士访问实验室

2019-06-19T16:08:54+00:00

微软亚洲研究院董力博士访问实验室 2019年6月19日,应实验室孙乐研究员和韩先培研究员邀请,微软亚洲研究院董力博士到访实验室,为实验室师生员工带来了一场题为《UNILM: Unified Language Model Pre-Training for Natural Language Understanding [...]

微软亚洲研究院董力博士访问实验室 2019-06-19T16:08:54+00:00

清华大学黄民烈副教授应邀做学术报告

2019-06-17T15:05:39+00:00

清华大学黄民烈副教授应邀做学术报告 2019年6月6日,应实验室孙乐研究员和韩先培研究员邀请,清华大学计算机系智能技术与系统实验室副主任黄民烈副教授到访实验室,为实验室师生员工带来了一场题为《Controllable text generation: types, knowledge, and planning》的学术报告。 黄老师的报告围绕自然语言处理领域条件文本生成的可控性问题展开,针对目前神经语言生成方面的三个主要问题——语义、一致性和逻辑,分别从“类型”、“知识”、“逻辑”和“规划”等层面提出了相应的解决方案,并介绍了相关工作。 在“类型”层面,通过在生成模块中显式地建模词类型的分布,来精细地控制文本生成,显著提高了生成文本的质量。在“知识”层面,通过对知识图谱进行建模,并引入知识图谱中的常识知识来协助理解上下文,从而提高了对话生成的连贯性和多样性。在“逻辑”层面,通过渐近编码的方式获得每一时刻的上下文线索,最终在解码时利用这个上下文线索预测正确的事件和实体。在“规划”层面,针对目前长文本生成领域面临的挑战,通过将键值对列表与训练预料关联起来,显式地将文本地生成过程进行了分解,提高了长文本生成的连贯性和一致性。 [...]

清华大学黄民烈副教授应邀做学术报告 2019-06-17T15:05:39+00:00