Latest News 2018-07-10T09:25:16+00:00
1904, 2019

INDICATIONS A RUSSIAN WOMAN LIKES YOU

INDICATIONS A RUSSIAN WOMAN LIKES YOU You’ve been familiarized for a number of years currently|time that is long, invested lots of time collectively, enjoy each other’s organization. Every little thing is apparently okey. But it’s large you knew if she likes you or perhaps not? If she views a great buddy inside you or she desires more? These article is just if you puzzled with these questions for. We’re going [...]

1804, 2019

Let us Speak About Daddy Problems in females

Let us Speak About Daddy Problems in females It should not come as a shock there are women with daddy problems. Then you most likely discovered a couple of your self. Some females have moderate daddy problems signs and that can respond acceptably. For other people, failure to own relationship that is emotionally healthy a daddy have really serious life effects. Females with daddy dilemmas exhibit these presssing problems mostly [...]

1704, 2019

On the web matchmakers: how to start off

On the web matchmakers: how to start off Like to locate a bride in Russia? Calculated the possibility and believe to succeed in internet dating? To obtain a target, you will be prepared to work, invest Power and money. On line matchmakers You recognize that, if effective, you’re going to have to deliver a international individual in your nation, understanding how to handle Russian mentality. Is therefore? Then let us [...]

1704, 2019

The Ultimate Organic Molecule Trick

Organic Molecule: the Ultimate Convenience!If you're a student, please remember a meeting is 70% networking. An act much like the Organic Food Products Act is vital for natural food products also, but it has not yet been made till now. Focus on those principles since they emerge.Energy is the ability to do work. We all must accept that the natural vs synthetic chemical debate isn't a black vs white issue, [...]

1704, 2019

Framework regarding the abstract. Expression of introduction part

Framework regarding the abstract. Expression of introduction part The abstract should mirror most of the architectural devices for the dissertation: the introduction, all chapters / sections, conclusions. In inclusion, mcdougal’s abstract necessarily provides the work of the scientist on the subject of study. The abstract is 100 % initial work that is scientific. It really is written aside because of the writer from scrape. No-one can and really should make [...]

1704, 2019

Intercourse along with your Ex: To get or Not to possess?

Intercourse along with your Ex: To get or Not to possess? You currently been able to get her to your sleep as soon as. Really, you made it happen several times. But those full times have died, and from now on intercourse along with her will probably develop into crisis for you personally. Or otherwise not? The theory is that, intercourse together with your ex should always be awesome: do [...]

1604, 2019

Just how to compose an abstract quickly, merely and completely?

Just how to compose an abstract quickly, merely and completely? The abstract is a research that is small for which students of a school, university or college is meant to show their capacity to make use of home elevators a specific subject. Its peculiarity is the fact that it doesn’t need an extremely deep immersion in a clinical issue, however it does not always mean that you need to underestimate [...]

1504, 2019

Just how to Date Somebody with Anxiety

Just how to Date Somebody with Anxiety Folks frequently don’t also observe the way the internal pleasure and anxiety, a nervous hope of some thing bad that will happen destroy love, relationship, and general well-being that is psychological. Each few encounters Unexpected difficulties in personal communication, which as a total outcome, can undermine and destroy perhaps the many stable and relationships that are strong. You frequently can hear tales about [...]

1504, 2019

Coordination and approval associated with calendar of specific work arrange for a dissertation in the division

Coordination and approval associated with calendar of specific work arrange for a dissertation in the division a plan that is individual of in graduate college and work with dissertations is the primary guiding document. This plan of action determines the annotated following: specialization, content, amount, terms of training regarding the graduate pupil, custom-writings.net/ the kinds of their official official official certification. The theme of the dissertation is formulated in this [...]

1504, 2019

Principal blunder of essay article writers and exactly how in order to prevent it

Principal blunder of essay article writers and exactly how in order to prevent it We now have currently talked about these or various various other mistakes of article article writers a few times, if it is a vital evaluation of certain instances or perhaps an occurrence all together. And after this, we’re going to talk about the most typical error that counter novices from doing an article or maybe more [...]

1104, 2019

Just how to Seduce a Leo lady: crucial Rules and Tips

Just how to Seduce a Leo lady: crucial Rules and Tips Leo may be the 5th indication, the part of that is fire, in addition to sunlight is its planet. Associates with this astrology sign will be the brightest individuals, with aspirations, pleasure and often self-esteem bordering regarding the pathological condition. Leo strives for energy, recognition, luxury and wealth more regularly than many other indications. During the time that is [...]

104, 2019

中文信息处理分工会组织春游活动

春意融融,长城怀古 阳春三月,草长莺飞,正是万物复苏的好时节。3月31日,中文信息处理实验室组织职工及学生40余人共同来到黄花城水长城景区,欣赏美景,放松心情。 黄花城水长城位于北京市怀柔区九渡河镇境内,因三段长城入水而得名,是北京唯一一处长城与水相连的长城。此处融青山、碧水、长城、古树为一体,有“塞外景,江南风,尽在水长城”的美誉。 拾级而上,水长城悠然而立,古朴自然。身处长城之上,漫山野桃花灿烂缤纷,灏明湖碧波粼粼,不时有小船掠过。大家通力合作,一起登上了长城的最高点,在这个过程中既感受到长城承载的厚重历史,也欣赏了自然的美丽风光。微风吹拂中,所有的疲惫都一扫而光。 除了雄伟的长城,归途上形态万千的板栗林,依山蜿蜒的盘山栈道,风景亦是美不胜收。在这样的美景中,大家心情愉悦,一路上欢声笑语,其乐融融。暮色四合,在农家小院的饭菜香味中,大家结束了一天的旅程。 欢乐不觉时光过。通过此次活动,大家放松心情,也将春天的生机与活力带回了实验室中。作为一个团体,中文信息处理实验室将继续奋进,一同前行! (供稿:陈晓阳)  

2503, 2019

北京大学冯岩松副教授应邀做学术报告

北京大学冯岩松副教授应邀做学术报告 2019年3月22日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,北京大学冯岩松副教授来访实验室,为大家带来一场题为“Combining Human Knowledge with Neural Network Models: A Case Study for SLU and Beyond”的学术讲座。 冯岩松老师的报告主要关注点在于如何将人类预先获得的知识融入到现有的深度神经网络架构之中,从而提升网络在少样本学习上的能力。具体来说,冯岩松老师围绕着意图识别和关系抽取两大任务,向大家介绍了多种将正则表达式以及预定义规则融入到神经网络学习过程中的方法,并详细比较了多种不同方法的优劣以及适用范围。最后,冯老师同大家分享了自己在信息抽取领域的丰富实践经验,并详细地解答了同学们提出的各种相关问题。

1203, 2019

For anyone who is prone to invite children who don’t understand just how to move, be certain you have some seniors constantly paying attention.

Most standard test documents don’t work like that. An expert essay writer understands just what it takes to make an essay Program is made for engines boating booze grammar check in sentence essay illustrations M20x1. Many academies and private tutors assert that you maynot make a special article on a certain issue ahead, but I differ. To have a first-class rating in your IELTS essay, you should recognize what a [...]

403, 2019

新浪微博张俊林博士应邀来实验室做学术报告

新浪微博张俊林博士应邀来实验室做学术报告 2019年3月1日,应实验室主任孙乐研究员的邀请,新浪微博AI Lab资深算法专家张俊林博士来访实验室,为师生带来一场题为“自然语言预训练技术及RNN/CNN/Transformer比较”的精彩学术报告。现场座无虚席,反响热烈。 张俊林博士首先介绍了NLP中的一些主要预训练技术的技术演进历程,从基础的word embedding技术到近一年来兴起的ELMO、GPT、BERT等语言模型。这些预训练语言模型采用无监督的学习算法,得以利用大规模的自然语言语料进行训练,在各类自然语言处理任务上均取得巨大突破。而作为BERT基础组件的Transformer近年来也得到广泛应用,在各项任务中均取得不少进展。然后,张俊林博士对自然语言处理中的三大特征抽取器Transformer、RNN和CNN的各自优缺点进行了对比分析。最后,张俊林博士又同大家分享了自己对近些年预训练语言模型发展趋势的展望,并详细解答了同学们提出的相关问题。  

203, 2019

中国科学院自动化研究所刘康副研究员应邀做学术报告

中国科学院自动化研究所刘康副研究员应邀做学术报告 2019年1月11日下午14:00,应实验室孙乐研究员与韩先培研究员的邀请,中国科学院自动化研究所刘康副研究员走进中文信息处理实验室,为实验室师生做了关于事件抽取的学术讲座。 刘康博士结合课题组近年来的工作进展, 向大家介绍了从非结构化文本中抽取结构化事件知识的基本方法, 以及应对开放域事件抽取标记数据稀缺的新思路。此外,刘康博士还和大家分享了深度学习方法在金融事件抽取应用项目中的经验和体会。 报告结束后,刘康老师与参会的师生进行互动,探讨了金融事件抽取相关的若干问题,现场气氛活跃。

103, 2019

复旦大学邱锡鹏老师访问实验室

复旦大学邱锡鹏老师访问实验室 2018年11月9日,应实验室韩先培研究员邀请,复旦大学计算机科学技术学院邱锡鹏老师走进中文信息处理实验室,为师生带来精彩学术报告,中科院软件所和自动化所的同学前来听讲座,现场座无虚席,反响热烈。 邱锡鹏老师以“如何端到端地写科研论文”为题,介绍了如何做科研和写出好的科研论文。老师先讲解了几大顶会的评审制度和审稿标准,然后又从同行评议的数据集出发,通过几种可解释性强的模型,分析了对于论文录用概率有影响的不同的写作方法和写作细节。邱老师又以自己组内ACL-2017的文章《Adversarial Multi-Criteria Learning for Chinese WordSegmentation》为例,详细讲解了文章的摘要、介绍、背景、方法、试验、相关工作和结论的写作中的注意事项。 报告结束,同学们获益匪浅,反响热烈,并和邱锡鹏老师一同合照。    

2512, 2018

2018年实验室代表性论文介绍

2018年实验室代表性论文介绍 一、基于区块提议网络的中文事件检测 事件检测则是事件抽取中的一个关键步骤。近年来,随着基于神经网络方法的发展,人们常常将事件检测转化为一个词级别的分类问题来对待。然而,基于词级别分类的事件检测方法没有考虑到事件触发词块与词的不匹配问题。特别是在中文当中,有许多的事件触发词块并不是一个特定的词。 针对上述问题,我们提出了一种基于区块提议网络的中文事件检测方法。具体地,我们的方法首先使用动态多池化卷积神经网络抽取字符级别和词级别的混合特征。之后基于混合特征的触发词块生成器可以在字符级别上直接给出整个触发词块的检测结果,从而避免了事件触发词块与词的不匹配问题。实验结果表明我们的方法在事件检测标准数据集TAC-KBP2017以及ACE2005上取得了State-of-the-Art性能。 上述成果长文发表在自然语言处理顶级国际会议ACL 2018会议上: Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun. Nugget Proposal Networks for Chinese Event Detection. In: Proc. of the 56th Annual Meeting of the Association for Computational Linguistics, pp. 1033-1043. Melbourne, Australia (ACL 2018) (CCF-A)   二、用于信息检测的动态缩放优化方法 信息抽取中的许多问题均可以被视为信息检测任务。与传统分类问题不同的是,信息检测任务有着显著的类别不平等问题。这种类别不平等主要表现在数据分布以及使用的评价指标上。这使得传统基于交叉熵的优化目标无法得到较好的优化结果。 针对上述问题,我们提出了一种基于动态重要性缩放的信息检测模型优化算法。该方法借用了经济学中的边际效用的理论,首先基于每个类别相对于评价指标的边际效用计算每个类别的重要性。之后在优化模型的过程当中,我们将该重要性加入到目标函数当中,从而使得整个优化过程能够与评价指标更加吻合。同时,我们还提出了一种具体的、用于批处理的神经网络检测模型的动态重要性缩放方案。我们的方法在中英文事件检测标准数据集TAC-KBP2017上取得了State-of-the-Art性能以及更好的优化稳定性。 上述成果长文发表在自然语言处理顶级国际会议ACL 2018会议上: Hongyu Lin, Yaojie Lu, Xianpei Han, Le Sun. Adaptive Scaling for Sparse Detection in Information Extraction. In: Proc. of the 56th Annual Meeting [...]

1711, 2018

自然语言处理国际著名学者Mark Steedman教授应邀到实验室访问并做学术报告

自然语言处理国际著名学者Mark Steedman教授应邀到实验室访问并做学术报告 2018年11月13日上午,爱丁堡大学Mark Steedman教授应孙乐研究员邀请,在中科院软件所3层会议室做了题为“Towards a Form-Independent Semantics for NLP”的公开学术报告,中科院软件所的孙乐研究员、韩先培研究员,中科院自动化所的刘康副研究员,等参加了报告,参加报告的还有以及来自软件所和自动化所的学者和学生。 报告中,Steedman教授介绍了他们组提出来的一种form-independent的语义表示,该语义表示基于一个知识图谱(knowledge graph)和一个蕴含图谱(entailment graph),与传统语义表示相比,该语义表示体系更贴近语言本身,同时能够更好的进行推理。该语义表示能广泛用于问答,机器翻译等,相关的论文将在今年的TACL上发表。Steedman教授的报告深入浅出,底蕴丰厚,耐人回味,深受观众喜爱,会场气氛热烈,大家都踊跃提问。 下午,Steedman教授单独访问我组,并与实验室的老师和博士生进行深入的交流。交流会上,每位博士生先介绍自己的研究工作,并就自己研究过程中所遇到的问题向Steedman教授请教,Steedman教授耐心的一一进行解答。孙乐研究员、韩先培研究员、陈波博士也就相关学术问题与Steedman教授进行了深入探讨。交流会持续了2个小时,大家都受益匪浅。会后实验室部分成员与Steedman教授进行合影留念。

1610, 2018

祝贺实验室林鸿宇和陆垚杰荣获2018年国家奖学金

祝贺实验室林鸿宇和陆垚杰荣获2018年国家奖学金 所研究生国家奖学金评审委员会于2018年10月15日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2017级博士林鸿宇同学、2016级硕士陆垚杰同学获得2018年研究生国家奖学金。值得一提的是,这是林鸿宇同学连续第2年获得博士国家奖学金。向两位同学表示祝贺!

310, 2018

A great short story is currently going to be read many times.

An essay is a vital component in finding a scholarship. Additionally this composition must supply complete information regarding getting a scholarship easily. Clearly, be sure that your documents will differ and will present different points of view. The very best school documents are the types that have a target. If you decide to follow scholarships by yourself without the aid of the significant college guidance office, you then should be [...]

310, 2018

It is required that you will get ready for the questions that you should inquire for your interviewer.

A whole lot of students buy documents every single day from us. Hence, to purchase essay online you must go with the experts. You can purchase school essays online. Obtain a wonderful opportunity to purchase essays online in purchase story article the simplest tactic. Money is a possibility for well-being in the current culture. It’s not measurable, may cash purchase you well-being article Article to purchase on the web rewarding, [...]

2008, 2018

第三届全国知识图谱与语义计算大会在天津召开,实验室论文荣获大会唯一最佳中文论文奖

第三届全国知识图谱与语义计算大会在天津召开,实验室论文荣获大会唯一最佳中文论文奖 2018年8月14日至17日,由中国中文信息学会语言与知识计算专委会主办的第三届全国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing,CCKS2018)在天津滨海新区圆满召开。我实验室安波同学论文荣获大会唯一的最佳中文论文奖。 作为国内自然语言理解领域的顶级盛会,CCKS2018吸引了来自国内各大高校、科研院所以及产业界的超过800人参与。本次大会的主题是“知识计算与语言理解”,会议聚焦于知识图谱及语义计算的相关问题,讨论建模、获取以及利用知识图谱这一外部知识模式的相关技术,解决自然语言处理领域的重要问题,推动人工智能的发展。 CCKS2018延续此前CCKS会议的特色,分为前两天(8月14日至8月15日)的前沿技术讲习班(ATT)以及后两天(8月16日至8月17日)的主会议。 主会议阶段的两天上午分别邀请了国内外的知名学者分享了关于人工智能以及知识图谱的特邀报告。8月16日上午的两个特邀报告分别来自清华大学的张钹院士和来自伦斯勒理工学院的James Hendler教授。张钹院士首先就当前人工智能所面临的问题做出了理性的分析与思考,解释了知识在人工智能发展中的重要性,以及知识与数据相结合的发展前景。James Hendler教授则详述了为了让智能系统更加可读并理解万维网中的信息而建立起的语义网(Semantic Web)的诞生与演变。8月17日上午的两个特邀报告别来自阿里巴巴的玄难副总裁以及来自罗马大学的Roberto Navigli教授。玄难副总裁首先介绍了阿里巴巴的生态系统和技术体系,并结合阿里巴巴生态链的具体应用场景给出了外部先验知识(知识图谱)在处理和增加这些场景方面的重大作用,从产业界的角度给出了知识图谱的未来应用前景。Roberto Navigli教授则介绍了跨语言知识图谱BabelNet的构建过程,并着重阐述了跨语言知识图谱在多种应用场景下了强大作用,在会上还演示了相关的系统演示视频,让人印象深刻。主会议阶段第一天的上午的最后还邀请了国内的优秀青年学者罗列和分析了在顶级会议中知识图谱相关论文的总体情况并介绍了一些优秀的论文。 主会议阶段的两天下午议程十分丰富。第一天下午首先由6篇优秀论文的作者分别做了口头报告。之后会议评测组织者报告了本次会议的评测和获奖系统,最后则由优秀的参评系统做了系统报告。第二天上午的最后时段创造性地让海报作者用30秒的时间介绍自己的系统,效果显著,之后的海报展示环节交流热烈。第二天下午则首先由10位来自产业界的技术人员分享了在产业界知识图谱的应用场景和相关架构。之后的圆桌会议则分别邀请了来自学术界和产业界的各自3人从各自角度阐述了知识图谱的发展与未来,碰撞出的智慧的火花让台下观众受益匪浅。 8月14日至15日的前沿技术讲习班,邀请到了来自加州大学圣巴巴拉分校William Wang副教授、来自阿伯丁大学的Jeff Pan教授、来自皇后大学的朱晓丹教授、来自卡塔尔的计算研究所的preslav nako教授、来自阿里巴巴的张伟老师以及来自科大讯飞AI研究院的刘权老师分享了关于知识图谱的利用与推理,知识图谱建模与知识获取,以及知识图谱的使用分享了前沿的学术思考与技术经验。William Wang副教授做了题为《深度知识图谱推理》的报告,从基于路径和基于嵌入式表示的两个路线介绍了知识图谱推理相关研究,并详细解析各自的优势与特点。Jeff Pan教授分别做了《开放知识图谱的利用与推理》的报告,介绍了当前的一些常见的开放知识图谱并详细分析了使用开放知识图谱进行知识推理的研究思路和优缺点。朱晓丹教授则从自然语言推理和语义组合方面详细介绍了他们实验室的相关工作,并分享了利用使用了外部知识来增强神经自然语言推理的相关工作。Preslav nako 教授则系统梳理了语义关系的发展历程以及关系模式的不同层次的特点,并介绍了抽取语义关系使用的实体或者关系的不同特征表示的优缺点;之后分别介绍了有监督和无监督两种关系抽取的相关技术路线以及基于嵌入式表示的相关方法和研究。张伟老师和刘权老师则从实践的角度具体详细地介绍了特定领域知识图谱的构建与应用,以及语义计算和知识问答的不同层次的不同研究思路和应用场景。 我实验室的老师和同学积极参与本次盛会,提交并被录用了总计3篇论文(录用率28%)及一个自然语言语义解析平台的演示系统。我实验室的安波同学、宋希良同学以及陆垚杰同学各有一篇论文被CCKS2018录用,分别是:《融合结构语义的知识库问答系统》(安波,韩先培,孙乐),《面向新类型人名识别的Data Augmentation方法》(宋希良,韩先培,孙乐)以及《基于语言学扰动的事件检测数据增强方法》(陆垚杰,林鸿宇,韩先培,孙乐)。其中安波同学的论文荣获了最佳中文论文奖!另外我实验室自主构建的自然语言语义解析系统作为演示系统,受到了参会人员的大量关注。      

907, 2018

祝贺实验室林鸿宇、陆垚杰、刘方超3位同学荣获2017-2018学年优秀学生

祝贺实验室林鸿宇、陆垚杰、刘方超3位同学荣获2017-2018学年优秀学生 根据《中国科学院软件研究所优秀学生评选办法》,经所评审小组评审,我实验室2017级博士林鸿宇同学获得“三好标兵”荣誉称号,2018级博士陆垚杰和刘方超同学获得2017-2018“三好学生”荣誉称号。

507, 2018

Four long papers were accepted by ACL2018

本研究室的四篇长文工作被国际顶级会议ACL2018会议录用 本研究室四篇长文被计算语言学领域顶级会议ACL2018录用,涉及的领域包括语义解析、事件抽取、论文自动评分等。 (1)Sequence-to-Action: End-to-End Semantic Graph Generation for Semantic Parsing; (2)Nugget Proposal Networks for Chinese Event Detection; (3)Adaptive Scaling for Sparse Detection in Information Extraction; (4)TDNN: A Two-stage Deep Neural Network for Prompt-independent Automated Essay Scoring

2706, 2018

祝贺实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号

祝贺实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号 陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号. 软件所今年共有毕业生100名,其中博士生27名,硕士生73名。 经软件所学术委员会评定,评选5名优秀博士毕业生和1名优秀硕士毕业生。 我实验室陈波博士荣获“中国科学院大学2017-2018学年优秀毕业生”荣誉称号。  

1606, 2018

实验室安波参加NAACL2018国际会议

实验室安波参加NAACL2018国际会议 本次参加NAACL2018国际会议有一篇长文被会议录用,论文内容是关于使用文本信息来增强知识图谱的表示,应用场景包括知识图谱的推理和补全。本文在主会场进行了海报展示,并与参会的其他研究人员进行深入的讨论,对宣传自己的工作未来工作都有很好的作用。 本次参会参加了两个tutorial,主要是知识图谱的构建和推理、基于深度学习的对话系统。更系统的学习了从信息抽取、知识图谱构建和知识图谱的表示和推理的内容,尤其是参会人员一起讨论了知识图谱的未来方向,对下一步的研究具有很好的指导价值。另外一个基于深度学习的对话系统则全面而深入的了解了对话系统这个方向的主要挑战、研究热点和目前的研究状态。以及如何从业务出发搭建一个基本的对话系统。   该会议的主会议有3天,内容涉及了计算语言学的各个主要研究方向。包括信息抽取、知识表示、深度学习在NLP的应用、问答系统、对话系统等等,具有很高的学习价值。 会议还要请了5个keynote,部分来自学届、部分来自工业界。其中关于认知的研究为计算语言学未来的发展提供了一定的启示作用。对于训练数据的多少也有很深入的讨论。 谷歌、亚马逊等分别就助手机器人和聊天机器人分享了自己的经验,并且做了展示Demo,对于该领域有了更加直观同时也更加深入的认识。 最佳论文环节选出了Emlo作为最佳论文,并且给出了该系统在不同的任务上起到的惊人作用,未来工作肯定可以用到。 会议还包含多个workshop,其中SemEval包含了多个NLP领域的核心评测任务,参会后学习其他研究团队对于这些任务的解决方案,对于自己和团队在未来参加评测或者研发产品都具有指导意义。    

2504, 2018

实验室参加阿里“藏经阁”知识引擎计划

     实验室参加阿里“藏经阁”知识引擎计划 4月21日上午,阿里巴巴联合中科院软件所、清华大学、浙江大学、中国科学院自动化所、苏州大学5所高校发布藏经阁(知识引擎)研究计划。 该计划以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网信息内容表达成更接近人类认知世界的形式,从而使计算机具备类脑推理能力。 同时,阿里还宣布打算用一年时间初步建成首个开放的知识引擎服务平台,服务中小企业。 实验室将围绕整个知识工程生命周期的知识建模、知识获取、知识管理和知识重用4个阶段与阿里巴巴公司及合作的科研院所共同展开相关研究。

1504, 2018

孙乐研究员参与翻译的《自然语言处理综论》出版

     孙乐研究员参与翻译的《自然语言处理综论》出版 孙乐研究员与冯志伟教程合作翻译的《自然语言处理综论》第二版于2018年3月份正式出版。 从本书第一版出版以来,一直好评如潮,被国外许多大学选作自然语言处理或计算语言学的教材,被认为该领域教材的“黄金标准”。本书第一版综合了自然语言处理、计算语言学和语音识别的内容,全面论述计算机自然语言处理,深入探讨计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。该版对于第一版做了全面的改写,增加了大量反映自然语言处理最新成就的内容,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书四大特色: 覆盖全面 强调实用 注重评测 语料为本内容简介本书全面论述了自然语言处理技术。本书在第一版的基础上增加了自然语言处理的最新成就,特别是增加了语音处理和统计技术方面的内容,全书面貌为之一新。本书共分五个部分。第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。本书写作风格深入浅出,实例丰富,引人入胜。本书可作为高等学校自然语言处理或计算语言学的本科生和研究生的教材,也可以作为从事人工智能、自然语言处理等领域的研究人员和技术人员的必备参考。          

904, 2018

祝贺实验室林鸿宇博士和刘泽宇硕士荣获2017年国家奖学金

祝贺实验室林鸿宇博士和刘泽宇硕士荣获2017年国家奖学金 所研究生国家奖学金评审委员会于2017年10月16日组织了公开答辩、评议,最后通过无记名投票表决,我实验室2017级博士林鸿宇同学、2005级硕士刘泽宇同学获得2017年研究生国家奖学金。

1501, 2018

自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会在软件所顺利召开

自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会在软件所顺利召开 8月16日,为了促进国内自然语言处理相关研究的发展以及研究者之间的交流,由中国中文信息学会青年工作委员会主办,搜狗公司承办的 “自然语言处理前沿技术研讨会暨EMNLP 2017论文报告会”在中国科学院软件研究所成功举办。来自中科院、北京大学、清华大学、复旦大学、哈工大、澳门大学等境内外高校和搜狗、百度、阿里等企业的科研人员和研究生200余人参加了本次研讨会和论文报告会。 本次会议由中国中文信息学会青年工作委员会执委、中科院软件所韩先培副研究员主持。中国中文信息学会副理事长及秘书长中科院软件所孙乐研究员,青工委主任清华大学刘洋副教授,搜狗公司搜索事业部许静芳总经理出席会议。中国中文信息学会青年工作委员会主任刘洋、搜狗搜索事业部总经理许静芳分别代表主办方和承办方致欢迎辞。 EMNLP是自然语言处理的顶级学术会议,2017年年会将于9月6日至12日在丹麦哥本哈根举行。本次论文报告会从国内被录用的近40篇长文中邀请了18篇论文作者进行提前报告,他们分别来自中科院、北京大学、清华大学、复旦大学、哈工大、澳门大学、哈工大深圳研究生院、南京大学、人民大学、东北大学、南京理工大学、黑龙江大学等多个高校。报告人深入介绍了各自在文本摘要、情感分析、机器翻译、信息抽取、自动问答、表示学习等多个领域的最新研究成果。会议实况经搜狐千帆直播平台向全网直播,4000多人观看了网络直播,众多网友和现场参会者线上线下联动,新的观点和灵感不断被激发、碰撞,会场气氛热烈。    

1501, 2018

中国中文信息学会承办的第53届国际计算语言学年会在北京成功举办

中国中文信息学会承办的第53届国际计算语言学年会在北京成功举办 2015年7月26-31日,由中国中文信息学会承办的第53届国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,ACL)首次在中国大陆召开。本次会议在北京国家会议中心举行,汇集了1200多名自然语言处理领域的国内外知名学者,是一次学术前沿和技术前沿交流研讨的国际学术盛会。 国际计算语言学协会主席Christopher D. Manning教授以Computational linguistics and Deep Learning为题在大会开幕式上做了专题报告。会议特别邀请了来自加州大学伯克利分校(UC Berkeley)的Marti A. Hearst教授和来自伊利诺伊大学厄巴纳-香槟分校(UIUC)的韩家炜教授作特邀报告。本次会议的最佳论文授予了来自慕尼黑大学的AutoExtend: Extending Word Embeddings to Embeddings for Synsets and Lexemes和来自都柏林大学圣三一学院的Improving Evaluation of Machine Translation Quality Estimation两篇文章。 在本次会议上,ACL将2015年ACL终身成就奖授予了中国中文信息学会理事长、哈尔滨工业大学李生教授。 ACL年会已有53年历史,是自然语言处理领域最高级别的国际学术会议,每年发表的论文都反映了自然语言处理领域的最新研究进展和学术动向,受到学术界和工业界的广泛重视。

1512, 2017

韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖

韩先培获得中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”一等奖 2016年12月23日,中国中文信息学会第八次全国会员代表大会暨学会成立35周年学术会议在北京隆重举行,会上颁发了“钱伟长中文信息处理科学技术奖”、中国中文信息学会“终身成就奖”、“汉王青年创新奖”以及中国中文信息学会优秀博士学位论文“拓尔思优秀博士学位论文奖”。软件所中文信息处理研究室韩先培副研究员获得“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。 韩先培多年来一直致力于自然语言理解和知识图谱相关的研究工作。自然语言理解是人工智能和自然语言处理的核心科学问题,在研究和应用领域都具有重要的作用。围绕自然语言理解,韩先培在开放域语义知识获取和知识驱动文本语义分析方面取得了多项研究成果。在国际顶级学术会议如ACL、SIGIR、AAAI、EMNLP、CIKM上发表重要论文30余篇,其中在自然语言处理顶级会议ACL上发表论文7篇,相关系统在国际权威评测SIGHAN 2012中文实体链接任务取得第一名的成绩。 韩先培的论文被同行广泛引用,其论文共获得国内外700余次引用,其中引用数超过100次的论文有三篇。特别是,SIGIR 2011论文在五年内被引用216次,在信息检索领域顶级学术会议SIGIR 近五年来发表的493篇论文中排在第2位,同时Google Scholar将SIGIR 2011和ACL 2011论文分别列在实体链接搜索结果的第1位和第5位。 此外,韩先培积极参与学术服务工作,曾参与北京国际计算语言学协会ACL 2015的组织工作;在中国中文信息学会,担任语言与知识计算专委会委员秘书长,担任青年工作委员会执委,参与并组织了大量的学术活动组织工作。 钱伟长中文信息处理科学技术奖是经科技部批准设立的中文信息处理领域的最高科学技术奖,主要授予该领域在基本方法或关键技术上有原始创新或重大突破,对推动我国中文信息处理事业或行业进步起到重要作用,创造出较大经济效益或社会效益的项目或个人。“汉王青年创新奖”设立于2010年,主要授予在中文信息处理领域做出突出贡献的青年学者。该奖项每两年评选一次。     

907, 2017

实验室参与编写《中文信息处理发展报告2016》

实验室参与编写《中文信息处理发展报告2016》 介绍了中文信息处理的各种技术研究进展呢,阅读本文有利于了解信息处理发展现状,确定自己的研究方向。 内容涵盖: 一、词法、句法、文法等 发展趋势: 1) 深度学习热潮席卷了NLP的各个任务;2)多粒度分词;3)面向非规范文本的分词;4) 分词、新词发现(词语归一化)交互建模; 5)互联网文本分析和领域自适应问题。 二、语义分析 1.  词汇级语义分析: 1)词义消歧;2)词义表示与学习(word embedding) 句子级语义分析: 1)浅层语义分析:基于句法分析的结果;2)深层语义分析 篇章级语义分析:识别文本中的所有篇章结构 目前主流的语义分析方法也是基于统计的方法,该方法以信息论和数理统计为理论基础,以大规模语料库为驱动,通过机器学习技术自动获取语义知识。 发展趋势: 短语/句嵌入的学习。 目前词嵌入已经在自然语言处理领域有了广泛的应用。如何为更大粒度的语言单位(如短语,甚至句子等)学习得到其相应的嵌入表示,已经成为目前研究的一个热点。 基于句子级语义分析的篇章融合 中文篇章分析 非规范文本的语义分析 三、语篇分析 包括 机器翻译、文本摘要、自动会话、机器阅读理解等 四、 语言表示与深度学习 科学问题 语言表示的认知机理:如何构建语言白哦是和知识表示的联系,人工知识库或大规模未标记预料来自动学习语言的表示 跨语种的统一语言表示: 如何为不同语种构建一种统一的语言表示模型,利用不同语言之间的共性,从而提高各个语言的表示能力 不同粒度单位的语言表示:如何构建 一个多粒度文本的联合语义表示模型,解决“一词多义”问题 基于少量观察样本的新词、低频词表示学习 技术方法 词表示:word embedding 的质量非常依赖于上下文窗口大小的选择。通常,大的上下文窗口学到的词嵌入更能反映主题信息,小的上下文窗口学到的词嵌入更能反映词的功能和上下文语义信息。 研究点:1)如何获得高质量词嵌入;2)如何利用已有知识库改进词嵌入模型,并结合知识图谱和未标注预料在同一语义空间中来联合学习知识和词的向量表示。 句子表示:如何有效地才词嵌入通过不同方式的组合得到句子表示,包括 神经词袋模型:词向量的平均 递归神经网络:按照给定外部拓扑(如成分句法树),不断递归得到整个序列的表示。 循环神经网络:将文本序列看作时间序列,不断更新得到整个序列的表示。 卷积神经网络:通过多个卷积层和子采样层,得到一个固定长度的向量。 篇章表示: 一般采用层次化的方法,先得到句子编码,再以句子编码为输入,得到篇章的表示。 循环神经网络非常适合处理文本序列,广泛应用在很多自然语言处理任务中。 五、知识图谱 知识图谱以结构化的形式描述客观世界中的概念、实体间的复杂关系,将互联网的信息表达成更接近人类认知世界的形式,提供一种更好的组织、管理和理解互联网海里信息的能力。 知识图谱与大数据及深度学习一起,已经成为推动人工智能发展的核心驱动力之一。 研究内容 知识表示 的 关键问题是 1) 建立什么样的知识表示形式能够准确地反映客观世界的知识; 2)建立什么样的知识表示可以具备语义表示能力; 3)知识表示如何支持高效知识推理和计算,从而使知识表示具有得到新知识的推理能力。 基于知识图谱的表示学习通过深度学习可以将知识表示成低维连续实值稠密的实值向量空间,有助于实现高效的知识计算. 知识图谱构建:是知识图谱技术最为关键技术之一,信息抽取和语义集成是知识图谱构建的核心技术问题。 知识图谱应用:基于知识的互联网资源融合、语义搜索、问答系统、基于知识的大数据分析和挖掘。 发展趋势 融合符号逻辑和表示学习的知识表示 高精确度大规模知识图谱构建: 如何从分布、异构、有噪音、碎片化的大数据中获得高质量的大规模知识图谱 知识图谱平台技术:如何建立知识图谱构建的平台,提供知识图谱的构建管道技术 基于知识图谱的应用研究: 何进一步应用知识图谱建立知识驱动的自然语言处理研究方法,基于知识的大数据分析和挖掘是非常值得研究的方向。 六、 [...]

Contact Info

4# South Fourth Street, Zhong Guan Cun, Beijing 100190

Phone: 86-10-62661012, 62661013

Fax: 86-10-62562533

Web: ThemeFusion

Recent Posts