中国自动化学会专家咨询工作委员会指定宣传媒体
新闻详情
isee-

十大科技趋势——半机人

http://www.gkong.com 2012-02-20 16:02 来源:二十一世纪商业评论

  2011年刚结束,CNN预测2012年的十大科技趋势中,与自然用户界面相关的技术发展趋势占据三席,触屏电脑名列榜首,声控技术和体感技术分列六、七位。人机交互的再一次变革就发生在你身边。

  你能想象身体是计算机的输入设备吗?

  体温、脉搏、肌肉都是向计算机传递指令的信号,佩戴于手臂上端的传感器能收集肌肉信号,再通过肌点信号识别器解读手势动作,从而识别手掌和手指点击在皮肤上的信号,向计算机传递无线信号,进而控制电脑,这就是肌肉-计算机界面,研究人员将它命名为“带有生理感知的自然用户界面”。

  这个略显生疏的长短语是自然用户界面的一种新形态,虽然自然用户界面并不是新鲜事物,但它的流行足以改变你和机器互动方式,随着自然用户界面应用的广度和深度的扩展,人机交互的技术革命必将引发一场新的科技产业变革。

  早期的自然用户界面是命令行界面和图形用户界面的补充。早在1970年代起,多位美国计算机学家进行了手势、多点触摸系统的实验,而彼时正是命令行界面和和图形用户界面的时代,用户需要借助键盘输入指令,或者用鼠标点击图形下达命令让机器完成相应的动作。

  而在自然用户界面,用户下达的指令是日常的行为,例如,手指触碰图标开启程序;与机器对话下达口头命令,如开机、关机、跳转窗口等;图标随着手指而移动……总的来说,自然用户界面利用手势、机器推断和意识情景以及丰富的3D环境让计算变得更简单、便捷,让用户的体验变得更加直观。

  IBM的科学家曾在2007年预测,5年后,人们不再需要密码。在没有传统字符密码的环境中,生物识别变得尤为重要,如指纹识别、视网膜识别、人脸识别。

  人脸识别技术的基础技术已经得到较成熟的发展,在公安、安防领域实现了较为广泛的应用。网易的最新研究则实现了基于互联网的人脸识别应用,人脸的录入、扫描、匹配工作均可通过互联网来完成。未来,你可能像《霹雳娇娃》中女战士在进入密室时那样输入邮箱、游戏账户的密码——通过人脸或者视网膜的匹配登录。网易称这项技术将有望在2012年上半年投入到网易邮箱登录上,“人脸识别技术不存在将军令、手机密码等传统密码使用中常出现的遗失、被盗的难题。”网易杭州研究院副总监汪源说,“用户可以选择传统的字符和人脸两种密码登录邮箱。”

  相比指纹识别、视网膜识别,人脸识别技术在密码保护领域有先天不足。虽然理论上说,配备超级计算机和超高清图像设备后,人脸识别精准度能达到99.9%,但现实条件很可能是室内光线、普通计算机和摄像头的组合。如果仅核对脸部图像是否匹配,一张照片就能破解密码了。

  但人脸识别技术在其他商业领域和社交媒体应用中的前景广阔。三电株式会社和冈谷株式会社研制了一款最新自动贩卖机,一旦顾客靠近机器,人脸识别系统将自动分析顾客的容貌来判定顾客的年龄,并播放适合该年龄层的广告。自动贩卖机2.0版将会推向北美市场。

  语音识别技术是也人机交互应用中的重要一环。人机对话的前提在于语音识别技术——语音识别和语义识别。语音识别即是机器捕捉到用户的话语,并将其在后台转化成计算机语言,而语义识别则是让计算机听懂用户所表达的含义。语音识别技术中的两个难点在于提高准确度和实现人工智能。

  UC优视研发出一款适用于手机的语音浏览器,它能减少用户在使用手机浏览网页时的输入动作,而把语言作为指令,包括前进、语言搜索、跳转网页等。

  但通常人们说的同一个词语能表达多个含义。“让机器在不同的场景下识别语义是语言识别系统的难点所在。”UC优视产品总监郑丛威说,“这就是人工智能需要解决的问题。”在现阶段,人工智能是基于对用户的使用习惯进行统计分析的结果而达到的智能。

  但如何让浏览器理解用户所说的指令是搜索相关网页,还是跳转到相应的网站呢?UC优视对用户使用UCweb浏览器的习惯进行统计分析,并选用概率最大的结果作为语音浏览器的指令。而遇到语音浏览器无法识别的场景,浏览器会出现多个选项共用户选择,这时用户还是需要手势等其他操作。

  2007年Google为了测试、改进其语音搜索技术,发布了免费的语音搜索服务。百度在2008年效仿Google公开测试了“百度语音搜索”的电话业务,但最终没有普及。2009年,Google便发布了中文版的语音搜索软件,运用于诺基亚塞班操作平台,但一直没有得到更广泛应用。

  事实上,移动互联网的快速发展是手机领域人机交互兴起的催化剂。受限于手机屏幕的尺寸,语音识别、语音搜索逐渐成为手机人机交互的新宠。在智能手机领域,UC语音浏览器仅是数目庞大的推广语音识别的软件之一,Siri的发布,掀起了人机对话的热潮,腾讯QQ、微信等即时通讯工具都具备了语音识别功能。为了省去用户在不到5英寸的小屏幕上打字的麻烦,韦伯斯特词典、有道词典都配备了语音识别功能。郑丛威预计语音识别和语音搜索的市场前景相当广阔,UC在2012年第一季度正式发布UC语音浏览器后,20%的用户会选择替代目前使用的版本。

  除了语音、人脸识别,捕捉人们的动作是自然用户界面的另一个重点领域。游戏终端设备已经在这一领域取得突破,Kinect游戏终端实现了人脸识别、手势、动作等综合自然用户界面技术。2010年11月4日微软发布Kinect的60天内,Kinect累计销售800万台,总销量突破1000万台,足可见其受欢迎程度。

  自然用户界面让人们甩掉鼠标和键盘玩游戏成为可能,这无疑挑逗着玩家的好奇心。

  智能游戏终端发布后,市场普遍认为Kinect可以实现更多的价值。由于机器可以捕捉并反应用户肢体动作,研究人员可以操控机器人进行科学研究,例如代替自己进入危险的事故现场进行操作。而Top Shop莫斯科旗舰店则打起了智能试衣镜的主意,用户只需要站在屏幕前,点击对应的商品,就可以“试穿”所有的衣服、鞋子,借助这一应用,服装电子商务能够得到更好的展示机会。

  自然用户界面强调用户通过语言、手势、动作,而不是键盘、鼠标操控计算机,以此来标榜“自然”。但不得不注意的是,自然用户界面也可能会带来一些“不自然”的结果。

  将捕捉到的动作传递到计算机,再由计算机反映在屏幕上的时滞引起了用户的不满,智能游戏终端机的反应速度和鼠标的反应速度还是有一定的差距。而一些对力道、角度要求严格的应用场合中,例如,远程医疗手术,自然用户界面所提供的体验还有很大的提升空间。此外,人工智能的研究还处于公司各自为营的分散阶段,也就是各个公司的统计结果存在差异,缺乏一个统一的人工智能标准,这可能会成为制约业界技术精准化的因素之一。

  “自然用户界面在目前还处于‘点’的突破阶段,要实现‘面’上的广泛应用尚需假以时日。”郑丛威说。

  但毋庸置疑,自然用户界面将会成为未来技术发展的主流。

版权所有 中华工控网 Copyright©2024 Gkong.com, All Rights Reserved