中国自动化学会专家咨询工作委员会指定宣传媒体
新闻详情
isee-

自主创新:不竭的动力1

——许嘉璐与“概念层次网络理论”的创新应用

http://www.gkong.com 2009-07-22 17:02 来源:中国自动化学会专家咨询工作委员会

  网络是把“双刃剑”。

  在网络融合、通信技术飞速发展的信息时代,除了病毒、黑客攻击,信息安全的范畴至少已经扩展到了通信干扰、窃取,信号阻断、置换,传输网络切断,隐私泄漏等更为复杂和宽广的层面。其中制黄贩黄、宣扬暴力、低俗的网上传播一度甚嚣尘上,严重影响着青少年的身心健康和社会稳定。截至2009年4月中旬,我国已经关闭了3000多个低俗网站。

  “我们的信息安全正在受到威胁。是不是仅仅依靠关闭网站就能一劳永逸?这如同大禹治水,仅仅靠‘堵’可能很难达到预期目的。最好的办法,除了强化法制、提高免疫力,还要有技术干预,而这种技术是可以实现的。”讲这番话的不是别人,正是一直关注我国信息安全问题的著名语言学家、原全国人大常委会副委员长许嘉璐。

  联手:信息高速路上共谋安全

  时光回溯到上世纪90年代初。

  “日读一卷书”书屋。许嘉璐坐在写字台前,悄然合上尼葛洛庞帝的《数字化生存》最后一页。望着窗外阑珊灯火,他思绪万千,强烈地感受到数字化带来的挑战,信息高速公路上时刻存在安全隐患,可能危及国家安全、社会稳定和国民经济发展的大局。

  这不是杞人忧天。2000年9月,第55届联合国大会发出十点倡议,号召全世界联合起来,共同防范网络犯罪。美国也在APEC会议上发出共同打击网络犯罪活动的倡议,呼吁世界各国从法律和技术两个层面加强网络安全防范,加大对网络安全犯罪和网络恐怖活动的打击力度。与此同时,人们看到,搜索引擎已经成为信息安全的重要目标之一,个别搜索引擎披露了一些国家的地理地域、军事设施和经济资源信息,引起世界各国的高度警觉。

  许嘉璐表示:“信息安全关系到国家根本利益,是国家安全的重要组成部分。这不只是学术界的‘热门话题’,更是值得全社会关注的重要现实问题。为了国家的安全,我们要有自己的计算机语言处理方式。”

  这时,许嘉璐担任着国家语委主任。作为训诂学家,他对古代汉语、现代汉语深有研究,此时又开始关注计算机语言处理。在他的主持提议下,国家语委设立了一个专业部门,负责管理和研究计算机语言处理工作。按照西方计算机语言理论操作进行的研究,始终未能跳出基于“理性”、“规则”、“关键词”窠臼,三四年后发现此路不通。许嘉璐为此食不甘味,夜不能寐。

  许嘉璐有一位老友叫黄曾阳,在中国科学院声学所工作,黄曾阳创立了一种立足于汉语特色的信息处理理论。黄曾阳的父亲是一位著名训诂学家。潜移默化的影响,使得黄曾阳古文古诗词功底非常深厚。上世纪五十年代“向科学大进军”的号召,促使黄曾阳进入北京大学物理系理论物理专业,1958年毕业后,来到中国科学院声学研究所工作。1988年以前的30年间,他主要从事信号处理和水声物理方面的研究,1989年以后,转向自然语言理解领域,由“听”水声改为“听”人声。由于兼有中国传统语言学、信号处理、哲学等方面的造诣,经8年卧薪尝胆,黄曾阳创立了计算机自然语言理解处理的“概念层次网络理论”,简称HNC理论。

  HNC理论摈弃传统方法,力图引导计算机模拟人类大脑对语言的感知模式去理解自然语言,借鉴吸收中国古人对语言理解的成果,在语言的语义层面上构建了概念的层次网络,并提出一种描述语句深层语义结构的简明语句分类序列和表示式,建立了可由计算机接受和操作的公式和分析模式,以使计算机具有理解自然语言的智能——这是几十年来未能攻克的世界性重大科学难题。

  1995年10月,北京正是霜染红叶的季节,中国科学院“香山会议”的一次主题会在香山饭店举行,研讨“跨世纪中文信息处理技术及其研究方向”,许嘉璐是这次会议的主讲人,会上,遇到老友黄曾阳,了解到黄曾阳正在进行的研究课题时,大有联手恨晚的感觉。许嘉璐将HNC理论列为我国中文信息处理三大流派之一,并对其发展寄予厚望。他不仅对黄曾阳的研究提供思想上的支持,还给予了研究经费上的帮助。

  鸿雁传书。许嘉璐与黄曾阳通过电邮传达各自的构想。后来,许嘉璐把自己的一些思路写成文章,收进文集。再后来,许嘉璐担任全国人大常委会副委员长,仍难以割舍研究计算机语言处理的情结。在视察HNC工作时,许嘉璐说:“这是落实科技兴国的一件实事。”许嘉璐亲自主持了国家计算机自然语言理解的“863”攻关项目。

  许嘉璐的得意门生、训诂学研究生陈小盟早年下海,在深圳从事研究与贸易,一路春风时,却意外地被导师召回北京。许嘉璐一脸严肃:“我想同你商量一件事。我们要有自己的计算机语言处理系统,这不仅是一项科研,重要的是关涉到信息安全与国家安全。把你的公司关掉,把这些年下海的赢利拿出来,注册一个IT公司,帮助黄先生把HNC基础理论研究搞起来。”

  陈小盟知道,西方语言学理论中有乔姆斯基的语言深层结构理论、奎廉的语义网络理论、山克的概念从属理论、菲尔墨的格语法,而中文的计算机语言信息处理与这些理论不尽相同,要有“字义基元化,词义组合化”的汉语研究背景,要有音韵学、训诂学和汉语语法研究及传统计算机语言学研究背景,才有可能胜任。而这几点,正是他的长处。2000年底,陈小盟毅然辞去北京麦纳科技公司总裁职务,带着1000万元投资,闯进中关村,与中科院声学所合作注册成立了北京大正语言知识处理研究院,黄曾阳受聘担任研究院的首席科学家。

  一项关系到国家信息安全的自主创新事业,序幕徐徐拉开。

  来源:光明日报

版权所有 中华工控网 Copyright©2024 Gkong.com, All Rights Reserved