中国自动化学会专家咨询工作委员会指定宣传媒体
文摘详情
gkongbbs

2021信息科学Top10发展态势。深度学习?卷积神经网络?

http://www.gkong.com 2021-12-23 13:11 金蓝海科技有限公司

在科学研究、高性能计算、生命科学、仿真模型等各行业的迭代更新的今天,信息科学几乎是所有学科中的基础,所以夯实基础势在必行,信息科学是研究信息运动规律和应用方法的科学,是由信息论、控制论、计算机理论、深度学习理论、人工智能理论、加速存储理论和系统论相互渗透、相互结合而成的一门新兴综合性科学。其支柱为信息论、系统论和控制论。

背景+

科学研究的世界呈现出蔓延生长、不断演化的景象。科研管理者和政策制定者需要掌握科研的进展和动态,以有限的资源来支持和推进科学进步。对于他们而言,洞察科研动向、尤其是跟踪新兴专业领域对其工作具有重大的意义。

为此,发布了 “信息科学”数据和报告。定义一个被称作信息科学的专业领域的方法,源自于科学研究之间存在的某种特定的共性。这种共性可能来自于实验数据,也可能来自于研究方法,或者概念和假设,并反映在研究人员在论文中引用其他同行的工作这一学术行为之中。

通过持续跟踪全球最重要的科研和学术论文,研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,可以发现信息科学。 当一簇高被引论文共同被引用的情形达到一定的活跃度和连贯性时,就形成一个信息科学,而这一簇高被引论文便是组成该信息科学的“核心论文”。信息科学的分析数据揭示了不同研究者在探究相关的科学问题时会产生一定的关联,尽管这些研究人员的背景不同或来自不同的学科领域。

总之,信息科学的分析提供了一个独特的视角来揭示科学研究的脉络。信息科学的分析不依赖于对文献的人工标引和分类(因为这种方法可能会有标引分类人员判断的主观性),而是基于研究人员的相互引用而形成的知识之间和人之间的联络。这些信息科学的数据连续记载了分散的研 究领域的发生、汇聚、发展(或是萎缩、消散),以及分化和自组织成更近的研究活动节点。在演进的过程中,每组核心论文的基本情况,如主要的论文、作者、研究机构等,都可以被查明和跟踪。通过对该信息科学的施引论文的分析,可以发现该领域的最新进展和发展方向。

2021 年,在以往系列信息科学报告的基础上,推出了《2021信息科学》分析报告。报告仍然以文献计量学中的共被引分析方法为基础, 基于Essential Science Indicators™ (ESI)数据库中的 12147 个信息科学,遴选出了 2021年自然科学和社会科学的11大学科领域排名最前的110个信息科学和61个新兴前沿。

方法论+

整个分析工作分为两个部分:信息科学的分析和重点信息科学(包括重点信息科学和重点新兴前沿)的遴选及解读由中国科学院科技战略咨询研究院科技战略情报研究所主持完成。 此次分析基于2015-2020年的论文数据。

1.1信息科学的遴选与命名

《2021信息科学》分析报告反映了当前自然科学与社会科学的11大学科领域的171个信息科学(包括110个热点前沿和61个新兴前沿)。我们以ESI数据库中的12147个信息科学为起点,遴选目标是要找到那些较为活跃或发展迅速的信息科学。报告中所列的171个信息科学的具体遴选过程如下:

1.1.1热点前沿的遴选

首先把ESI数据库的20个学科划分到11①个高度聚合的大学科领域中,然后对每个ESI学科中的信息科学的核心论文,按照总被引频次进行排序,提取排在每个ESI学科前10%的最具引文影响力的信息科学,并将其整合到11大学科领域中,以此数据为基础,再根据核心论文出版年的平均值重新排序,遴选出每个领域中那些“最年轻”的信息科学,并由各学科战略情报研究人员进行调整和归并。通过上述几个步骤在每个大学科领域分别选出10个热点前沿,共计110个热点前沿。 因为每个领域具有不同的特点和引用行为,有些学科领域中的很多信息科学在核心论文数和总被引频次上会相对较小,所以从11 大学科领域中分别遴选出的排名前10的热点前沿,代表各大学科领域中最具影响力的信息科学, 但并不一定代表跨数据库(所有学科)中最大最热的信息科学。

1.1.2新兴前沿的遴选

一个信息科学有很多新近的核心论文,通常提示其是一个快速发展的专业研究方向。为了选取新兴的前沿,组成信息科学的基础文献即核心论文的时效性是优先考虑的因素。这就是为什么我们称其为新兴前沿。为了识别新兴前沿,我们对信息科学中的核心论文的出版年赋予了更多的权重或优先权,只有核心论文平均出版年在2019年6月之后的信息科学才被考虑,将每个ESI学科的信息科学按被引频次从高到低排序,选取被引频次排在前10% 的信息科学,然后各学科战略情报研究人员经过调研和评审,遴 选出每个ESI学科中的新兴前沿, 并将其整合到11大学科领域中, 从而遴选出了 11大学科领域的61 个新兴前沿,这61个新兴前沿最早的平均出版年是2019.5。遴选不限定学科,因此61个新兴前沿在11大学科领域中分布并不均匀, 例如,数学领域没有新兴前沿入选,物理学、地球科学、信息科学等领域分别只有一个新兴前沿,而临床医学领域则选出了29个新兴前沿。通过以上两种方法,这份报告突出显示了 11个高度聚合的大学科领域中的110个热点前沿和61个新兴前沿。

1.1.3信息科学的命名

由各学科战略情报研究人员, 根据信息科学的核心论文的研究主题、主要内容和特点等,对171个信息科学逐一进行命名,并征求专家意见调整确定。

1.2信息科学的分析及重点信息科学的遴选和解读

本报告在遴选的171个信息科学的数据的基础上,由中国科学院科技战略咨询研究院的战略情报研究人员对11大学科领域的110个热点前沿的发展趋势进行了分析,并对31个重点信息科学和 2个前沿群进行了详细的解读(见后续各章)。重点信息科学包括重点热点前沿和重点新兴前沿两部分。

信息科学由一组高被引的核心论文和一组共同引用核心论文的施引文献组成。核心论文来自于ESI数据库中的高被引论文,即在同学科同年度中根据被引频次 排在前1%的论文。这些有影响力的核心论文的作者、机构、国家在该领域做出了不可磨灭的贡献, 本报告对其进行了深入分析和解读。同时,引用这些核心论文的施引文献可以反映出核心论文所提出的技术、数据、理论在发表之后是如何被进一步发展的,即使这些引用核心论文的施引文献本身并不是高被引论文。

1.2.1重点信息科学的遴选

2014年设计了遴选重点信息科学的指标CPT,2015年在年篇均被引频次(CPT)指标的基础上, 又增加了规模指标,即核心论文数(P)。

(1)核心论文数(P)

ESI数据库用共被引文献簇(核心论文)来表征信息科学, 并根据文献簇的元数据及其统计结果揭示信息科学的发展态势, 其中核心论文数(P)总量标志着信息科学的大小,文献簇的平均出版年和论文的时间分布标志着 信息科学的进度。核心论文数(P)表达了信息科学中知识基础的重要程度。在一定时间段内,—个前沿的核心论文数(P)越大,表明该前沿越活跃。

(2)年篇均被引频次(CPT)

遴选重点信息科学的指标年篇均被引频次(CPT)的计算方法是核心论文的总被引频次(C)除以 核心论文数(P),再除以施引文献所发生的年数(T)。“施引文献所发生的年数”指施引文献集合中最新发表的施引文献与最早发表的施引文献的发表时间的差值。如最新发表的施引文献的发表时间为2020年,最早发表的施引文献的发表时间为2016年,则该施引文献所发生的年数为4。

CPT实际上是一个信息科学的平均引文影响力和施引文献发生年数的比值,该指标越高代表该前沿越热或越具有影响力。它反映了某信息科学的引文影响力的广泛性和及时性,可以用于探测信息科学的突现、发展以及预测信息科学下一个时期可能的发 展。该指标既考虑了某信息科学受到关注的程度,即核心论文的总被引频次,又考虑了该信息科学受关注的时间长短,即施引文献所发生的年数。

在信息科学被持续引用的前提下,当两个信息科学的P和T值分别相等时,则C值较大的信息科学的CPT值也较大,指示该信息科学引文影响力较大。

当两个信息科学的C和P值分别相等时,则T值较小的信息科学的CPT值会较大,指示该信息科学在短期内受关注度较高。

当两个信息科学的C和T值分别相等时,P值较小的信息科学的CPT反而会较大,指示该信息科学中核心论文的平均引文影响力较大。

《2021信息科学》在重点信息科学的遴选过程中,从每个大学科领域的10个“热点前沿”中, 利用核心论文数(P)和CPT指标,结合战略情报研究人员的专业判断,遴选出两个重点热点前沿。 专业判断主要考虑该前沿是否对解决重大问题有重要意义。一方面, 选择核心论文数(P)最高的前沿, 如果P最高的前沿已经在往年的研 究前沿中解读过且核心论文没有显著变化,则选择P次高的前沿, 依次类推。同时,用CPT指标结合专业判断遴选出一个重点热点前沿。综合这两种方法共遴选出22 个重点热点前沿。从新兴前沿中, 利用CPT指标结合战略情报研究人员的判断遴选出9个重点新兴前 沿和2个新兴刖沿群。因此从171 个信息科学中共遴选出31个重点前沿和2个前沿群进行深入解读。

1.2.2信息科学的分析和解读

在报告遴选的171个信息科学的数据基础上,综合分析11大学科领域的110个热点前沿的发展趋势,研究揭示新兴前沿的研究主题, 并对33个重点信息科学(群)进行了详细的解读。

(1)热点前沿分析及重点热点前沿的解读

对于每个学科领域,结合TOP10热点前沿的核心论文的数量、被引频次、核心论文平均出版年,以及施引论文的年度变化,分析TOP10热点前沿的发展趋势, 包括覆盖的重点方向、前沿(群) 分布特征及演变趋势。

每个学科领域的第一张表展示各自的前10个热点前沿的核心论文的数量、被引频次以及核心论文平均出版年。每个领域的10个热点信息科学中引用核心论文的论文(施引文献)的年度分布用气泡图的方式展示。气泡大小表示每年施引文献的数量,对于那些施引文献量大、而施引文献所发生的年数少的前沿,也就是CPT值的前两种情况,可以从图中直观地看出哪些是重点热点前沿。但是对于核心论文(P)较少的情况,则需要结合数据来看。大部分信息科学的施引文献每年均有一定程度的增长,因此气泡图也有助于对信息科学发展态势的理解。

对每个学科领域遴选出的两个重点热点前沿,深入分析解读其概念内涵、发展脉络、研究力量布局等,揭示被引频次较高的核心论文的研究内容、价值、影响。

每个重点热点前沿的第一张表对该热点前沿的核心论文的产出国家、机构活跃状况进行了统计分析, 有助于揭示出哪些国家、机构在该热点前沿中有较大贡献。第二张表 则对该热点前沿的施引文献的产出国家和机构进行了统计分析,有助于探讨哪些国家、机构在该热点前沿的发展中的研究布局。

(2)新兴前沿分析及重点新兴前沿的解读

新兴前沿的体量(核心论文及 其施引文献)较小,统计数据的分析意义不大。因此,主要由战略情报研究人员揭示新兴前沿的研究主题,并对重点新兴前沿的核心论文及相关信息进行内容方面的定性分析解读,籍此可以了解重点新兴前沿的基本概念、最新科研突破及未来发展前景。

信息技术+

1.热点前沿及重点热点前沿解读

1.1信息科学领域Top 10热点前沿发展态势

信息科学领域位居前十位的热点前沿主要集中于面向6G通信、 植物分类和病害检测、心电图分类和心率失常自动诊断、人类活动识别、视频动作识别、多模态情感分析、电子健康档案数据挖掘等领域的深度学习方法研究,以及区块链技术、通路数据库、无人机辅助通信技术等方向,与深度学习相关的主题占据了今年Top10 热点前沿的大部分主题。“基于无人机的无线通信技术”是2020年热点前沿“无人机无线通信网络、 传输保密和轨迹优化研究”的延续和扩展,其他前沿主题均为首次入选。

信息科学领域Top 10热点前沿

信息科学领域Top 10热点前沿的施引论文

1.2重点热点前沿一“面向视频动作识别的深度神经网络研究”

随着视频设备和网络的普及,视频理解和动作识别吸引了越来越多研究者的关注。相比图像来说, 视频内容和背景更加复杂多变,不同的动作类别之间具有相似性,而相同的类别在不同环境下又有着不同的特点。目前,视频动作识别常用的技术有基于人工特征的视频动作识别、基于双流的神经网络、基 于三维卷积的神经网络等。在实际应用中,精确的动作识别有助于舆情监控、广告投放、视频检索、智能医疗监控、自动驾驶和交通安防等相关的任务。

热点前沿“面向视频动作识别 的深度神经网络研究”包含13篇 核心论文,内容涵盖视觉基因组 (Visual Genome)数据集、动作识别的时空表示学习、深层视觉语义对齐、基于长期递归卷积网络的视觉识别和描述、长期时间卷积动作识别、用于动作识别的非对称三维卷积神经网络、用于动作识别的时空可变形三维注意网络。在被引频次超过100次的7篇核心论文中 ,美国主导发表3篇,分别来自加州大学伯克利分校和斯坦福大学,后者贡献两篇;中国主导发表2篇,分别来自中国科学院深圳先进技术研究院和天津大学;法国主导发表2篇,分别来自法国国家信息与自动化研究所和法国国家科学研究中心。

在13篇核心论文中,被引频次最高的是加利福尼亚大学伯克利分校Jeff Donahue博士 2017年发 表在《IEEE Transactions on Pattern Analysis and Machine Intelligence^ 上 的 “Long-Term Recurrent Convolutional Networks for Visual Recognition and Description”,被引209次,文章提出一个长期时间递归卷积网络(LRCN)模型,一种适用于大规模视觉学习的端到端可训练的新型递归卷积结构,并展示了这些模型在基准视频识别任务、图像描述和检索问题以及视频叙述挑战方面的价值。被引频次较高的论文 还包括斯坦福大学李飞飞团队2017 年发表在 “International Journal of Computer Vision^ 上的“Visual Genome: Connecting Language and Vision Using Crowdsourced Dense Image Annotations",该论文利用众包 方法构建了视觉基因组(Visual Genome)数据集,这是第—大 规模的视觉关系数据集,提供物体的交互和属性的详细标签,将语义和图像结合起来,推动人工智能的进一步发展。Visual Genome是李飞飞教授团队后ImageNet时代在计算机理解图片上的训练和测试数据集的又一重要成果。

美国和中国各贡献5篇核心论文,法国贡献3篇,荷兰和英国各贡献2篇。从核心论文的机构分布看,法国布列塔尼卢瓦尔大学、法国国家信息与自动化研究所和中国科学院各贡献3篇并列第一,美国斯坦福大学贡献2篇排名第二。

“面向视频动作识别的深度神经网络研究”研究前沿中核心论文的Top产出国家和机构

施引论文的角度来看,中国表现最突出,以630篇施引论文遥遥领先排名第二的美国(176篇),英国、澳大利亚、印度、 韩国等也表现不俗。施引论文Top产出机构全部为中国机构,中国科学院、天津大学、浙江大学位列前三甲,表明中国一批大学和科研机构在该前沿迅速开展了跟进研究, 并产出了众多研究成果。

“面向视频动作识别的深度神经网络研究”研究前沿中施引论文的Top产出国家和机构

1.3重点热点前沿一“基于无人机的无线通信技术”

随着物联网应用的普及,无线网络将支持数量庞大的接入设备, 当前的蜂窝基础架构将迎接巨大的挑战。而仅依靠部署传统的地面基站很难实现万物互联,例如,在偏远或者地势险峻的区域部署地面基站面临着成本高、部署难度大的问题;在灾害发生区域和体育赛场等紧急和临时的特殊场景中,地面基站可能会出现过载甚至发生故障, 而临时部署地面通信设施耗时且耗资巨大。随着低成本、小型化和集成化无人机在民用和工业领域的广泛应用,将无人机作为空中基站辅助地面通信成为解决临时性特殊区域通信问题的有效方案,也使搭载先进收发信机和智能传感设备进行高速数据传输成为无线通信领域的又一新的研究热点。在2021 年7月中国河南省多地遭遇强降雨期间,搭载了移动公网基站的“翼 龙” -2H无人机空中应急通信平台,实现了约50平方公里范围5小时的连续稳定移动信号覆盖,打通应急通信保障生命线。

热点前沿“基于无人机的无线通信技术”包含11篇核心论文,聚焦于通过无人机轨迹优化提高能量效率;下行通信中多用户最小吞吐量的最大化方案,包括通过优化多用户通信调度和关联以及无人机的轨迹和功率控制来实现,通过联合优化无人机轨迹和正交频分多址资源分配来实现等;使用户覆盖数量最大化的无人机车载基站部署算法等。被引频次在300次以上的论文共有5篇,其中4篇来自新加坡国立大学,另一篇来自美国弗吉尼亚理工大学。被引频次最高的论文是新加坡国立大学 Zeng, Yong等人于2016年发表在《IEEE Communications Magazine》 上 的 “Wireless Communications with Unmanned Aerial Vehicles: Opportunities and Challenges” 一文,被引729次。文章概述了无人机辅助无线通信的基本网络架构和信道特性,重点介绍了通信系统的 关键设计考虑因素,以及有待开发的新机遇。

新加坡贡献了该前沿的大部分研究工作。从核心论文的机构分布看,新加坡国立大学发表的核心论文最多;华为公司的法国研发中心与法国巴黎萨克雷大 学、美国弗吉尼亚理工大学和芬兰奥卢大学合作发表2篇论文。

“基于无人机的无线通信技术“研究前沿中核心论文的Top产出国家和机构

2.新兴前沿及重点新兴前沿解读

2.1新兴前沿概述

信息科学领域有1项研究入选新兴前沿,“利用医学影像检测和诊断新冠肺炎的深度神经网络研究”。

2.2重点新兴前沿解读一“利用医学影像检测和诊断新冠肺炎的深度神经网络研究”

与新冠肺炎作斗争的一个关键步骤是对受感染患者进行有效筛查,以便受感染的病人能够立即得 到治疗和护理,并被隔离以减轻病毒的传播。如何利用先进的人工智能深度学习技术迅速、准确地识别出新冠肺炎病情成为信息科学领域 的新兴重点研究方向。

该前沿围绕着如何利用深度学习技术在医学影像数据中迅速识别新冠肺炎展开研究。在数据源方面,大部分研究使用X光片进行自动识别,有2篇文献采用CT影像数据进行识别。在疫情初期,由于可用的数据集较小,部分研究采用数据增强的方法进行深度学习训练,提升对新冠肺炎的识别性能。在识别方法方面,涉及了辅助分类器生成对抗网络(GAN)、深度迁移学习方法、多目标差分进化卷积神经网络、Deep Bayes-Squeeze Net等。

版权所有 中华工控网 Copyright©2024 Gkong.com, All Rights Reserved