中国自动化学会专家咨询工作委员会指定宣传媒体
新闻详情
isee-

自主创新:不竭的动力2

——许嘉璐与“概念层次网络理论”的创新应用

http://www.gkong.com 2009-07-22 17:07 来源:中国自动化学会专家咨询工作委员会

  要素重组:让自主创新能力无穷大的秘密

  许嘉璐(右)和他的学生陈小盟(左)。中为河北省委常委、唐山市委书记赵勇(时任团中央书记处书记)。

  许嘉璐曾经撰文指出,HNC的研究,第一,必须采取集体攻关的办法;第二,可以用“百花齐放,百家争鸣”的方针,不拘一格,几种风格齐头并进,既相互竞争,又彼此取长补短;第三,采用科学的管理办法,按照科学研究的规律管理;第四,既要争取国家的支持,又要尽量与企业合作;第五,既要出成果又要出人才;第六,中文信息处理事业将是长期的,要有薪火相传的准备;第七,允许失败,在不断失败—研究—再失败—再研究的循环往复中前进。

  按照这一思路,北京大正语言知识处理研究院十分注意生产要素重组工作,他们要让自主创新的能力无穷大。

  在许嘉璐的主持建议下,2004年1月,北京师范大学成立了中文信息处理研究所,以发挥语言学与应用语言学学科优势,加强中文信息处理应用基础研究;促进语言学与计算机等相关学科的交融,推动计算机语言学这一交叉学科的发展;搭建中文信息处理领域的合作平台,汇集高校、科研院所、高科技企业的专家学者集体攻关,探索中文信息处理理论与应用研究的新路;为国家培养兼通语言学与计算机科学的“两栖型”专业人才;保持我国在语言信息技术领域的竞争力,保障国家、民族和社会的信息安全。

  而北京大正语言知识处理科技有限公司,具有民营性质,是针对自然语言理解处理的理论探索及其技术应用的高新技术企业,是科技成果转化的基地。

  根据许嘉璐的意见,研究院第二个资源重组的表现为全新的“学、研、产、用”相结合的产业化创新之路。许嘉璐多次指出,中文信息处理事业事关国家安全和社会稳定,它的发展需要加强基础研究、应用研究和社会需求三者的结合,需要语言学界和计算机科学界专家学者的密切配合、共同攻关。HNC基础理论和技术及其应用研究过程中,课题组通过探索市场经济条件下的科学研究模式和项目管理模式,组织了中国科学院、北京大学、清华大学、上海交通大学、北京大正语言知识处理研究院等高校、科研院所、高科技企业的专家集体攻关,打通语言学与计算机科学的壁垒。

  中国计算机语言学专业委员会第一届主任鲁川,在《有关“科学”和“语言”的畅想》一文中写道:“HNC是自然科学跟人文科学交叉的新兴‘智慧科学’的一个典型代表。在探索过程中,北京大正语言知识处理研究院根据社会生产需求拓展研究领域,以理论研究促进方法学的创新。以应用方法学创新,催生应用成果的实现,用应用成果转化反哺基础研究,使自主创新逐步走上了良性循环的道路。”

  持续创新:“核心竞争力”的金钥匙   

  许嘉璐(前右)与陈小盟(后左)在工作中。

  在强手如林的竞争中,北京大正语言知识处理研究院招兵买马,广纳贤才,依托黄曾阳的HNC理论,在许嘉璐的精心指点下,潜下心来,埋头HNC基础理论研究和各项实验,一干就是8年。这8年,得到了慧眼识珠的中关村管委会和北京市委、市政府的大力支持。

  八度燕来雁去,八度星回岁改,八度寒来暑住,八度春华秋实。

  8年前,黄曾阳的理论还只是一些公式和PC机上的初步模版演示。8年后,他已经是诗情画意,收获满囊。他的专著《HNC(概念层次网络)理论∶计算机理解语言研究的新思路》由清华大学出版社出版,概念层次网络的研究,对语义文本、分词等等的研究渐入佳境。黄曾阳也桃李满枝,不少学子志愿投身到HNC理论这一具有自主知识产权的研究中,并不断寻求新的创新与突破。

  8年中,研究院一步一个脚印,捷报频传:

  2001年6月,研究院成立半年后,HNC网络信息智能过滤器样板机诞生并进入中试。年底,过滤器开始试应用。它能有效地识别文本信息内容,提高了智能与自动识别能力,对网络中流动的海量电子文本信息进行目标搜索与追踪。这一成果,使我国在信息语言知识处理领域的国际竞争中占据领先地位。

  2003年4月,“HNC信息智能过滤器”以其卓越的品质通过公安部计算机信息系统安全产品质量检测,5月,取得公安部颁发的《计算机信息系统安全产品销售许可证》,6月,取得国家版权局颁发的软件著作权登记证书。

  2004年,“HNC信息智能过滤器”获得北京市科委颁发的软件企业认定和软件产品登记认定。

  2005年,研究院参与承担的“中文信息处理应用基础研究”课题,顺利通过国家高新技术研究发展计划(863计划)验收,HNC开始形成了具有原始创新特点的理论与技术体系。

  2007年,研究院承担了国家科技支撑计划“中文信息处理应用研究与系统开发”课题的研发。

  2008年5月,工业和信息化部公布:大正研究院的“花季护航”上网管理软件,中标“绿色上网过滤软件产品一年使用权及相关服务采购”项目,成为国内相关领域软件产品中惟一入选文字过滤产品……

  8年来,大正研究院和北京师范大学中文信息处理研究所一起,先后承担了包括国家重点科技支撑中文信息处理应用研究与系统开发项目(即原国家973计划项目)、国家863计划项目及中科院知识创新工程项目等科研任务。

  8年来,大正研究院在国内外学术期刊发表论文60余篇,取得了2项发明专利、17项计算机软件著作权。

  总结8年的创新实践之路,研究院董事长陈小盟感慨良多。

  陈小盟说:“思想与理念有多远,创新之路就会有多远。在大正研究院,我们提炼了这样一条理念:HNC语言知识处理基地是一株大树;HNC语言知识、HNC概念联想网络、以此为基础吸收进来的其他理论应用成果、世界知识是它的根;建立在对语言的语义理解的基础上,应用在计算机对语言信息的智能化处理的多个层面是它的果实。”

  按照许嘉璐的构想,研究院更像一个孵化器,在特殊机制催生下,HNC理论好比种子,市场需求好比土壤,北京大正语言知识处理研究院的基础理论研究好比耕耘,而实用技术和项目则是阳光雨露下破壳而出的新生命。

  党的十七大以后,他们认真学习科学发展观,对自主创新开始了新一轮的反思。经过总结经验教训,逐步达成共识:研究院的核心竞争力,来自持续不断的自主创新;自主创新的动力来自市场需求。自主创新是一个科技、经济一体化过程,是技术进步与应用创新共同作用催生的产物,从而对知识社会条件下以需求为导向、以人为本的创新模式更加坚定不移。

  八年“潜伏”:赢得“红杏枝头春意闹”

  黄曾阳(中)在一次机器翻译研讨会上。

  黑格尔说过:“要是没有热情,世界任何伟大事业都不会成功。” 

  作为HNC基础研究课题的重要承担单位之一和成果转化基地,大正语言知识处理研究院、大正语言知识处理科技有限公司汇集了一大批莘莘学子。他们甘于奉献,耐得住寂寞。许嘉璐说:“在IT界员工的收入一般是可观的,而且跳槽早已司空见惯,‘大正’的收入只能说是中等水准,但到这里工作的学子们很少抱怨。大家默默耕耘,无私奉献,就是为了让具有自主创新的技术能够茁壮成长,就是为了提高国家的科技软实力。”

  自主创新激发出蓬蓬勃勃的活力,HNC基础理论研究犹如一株青翠欲滴的新苗,一旦破土而出,就呈现出日新月异的景象。自主创新不断推动着科研成果的产业化进程,随着基础理论研究的深化,“大正”的系列产品脱颖而出。

  在推出HNC信息智能过滤器后,研究院又针对家庭、学校、网吧、企事业单位等不同用户群推出系列产品,形成丰富的产品线。值得称道的“花季护航”上网管理软件,刚刚出炉就炙手可热,被全国妇联“百万家庭护苗工程”确定为指定产品。“花季护航”上网管理软件,运用特有的语义判定技术,能够自动判定识别信息的褒贬义,对黄色暴力黑色等不良信息进行有效的防止与过滤。海量内容审查和管理系统——自动审查软件,是针对海量内容难于搜索、难于管理,人工审核费时费力等问题而开发的一款自动审查出版内容的软件,让计算机模拟人脑,在“理解”的基础上判断文本内容,有效地解决了误审核的问题,提高了审核的准确度。

  与此同时,北京大正语言知识处理研究院还面对汉语加快走向世界的客观需求,开发推出了创新、实用、大众化的“汉语之声”网站,用户可以在汉语之声网站享受学习汉语、体验中国文化、订购中国文化产品等专业服务。

  面对果实累累的今天,许嘉璐说:“自主创新是实现民族复兴的不竭动力,中华民族要自立于世界民族之林,要展翅腾飞,就要不断提升科技软实力,依靠自主创新变中国制造为中国创造。要在自主创新中出成果、出人才。北京大正语言知识处理研究院开发HNC基础理论技术,并通过自主创新取得了初步成果,这仅仅是一个尝试。相信我们国家会有大批类似HNC这样的自主知识产权理论和技术诞生,也相信会有大批北京大正语言知识处理研究院式的IT企业脱颖而出。”

   来源:光明日报

版权所有 中华工控网 Copyright©2024 Gkong.com, All Rights Reserved