http://www.gkong.com 2022-06-22 14:12 来源:上海证券报
作为成渝地区东数西算的深度参与者,特斯联近期对外公布了其计算机视觉(CV)领域的多个科研突破,并有8篇论文被CVPR、TPAMI等顶级国际学术会议和期刊收录。
此次,特斯联在CV领域的科研突破涵盖语义分割、图像增强、显著物体识别、迁移学习、行为识别等方面。其中不少创新技术打破了现有技术上限,亦开发了数个性能更优、识别更快、效率更高的模型,这些技术研究的应用与推广将成为特斯联赋能城市数字化、智能化的有力保障。
在机器视觉行业产业链中,如上游的光源、镜头、工业相机、图像处理器、图像采集卡等硬件,图像处理软件和底层算法等软件系统会随着机器视觉的迭代而快速发展,推进整个产业链的升级。特斯联集团首席科学家兼特斯联国际总裁邵岭博士及其团队在该领域中提出的图像和视频的识别和学习各算法,极大缩短了训练和推理时间,从图像识别提升、识别效率提升以及解决数据标注瓶颈三个方面,提升了整体视觉应用效果。
图像识别提升方面,团队的技术突破主要集中在算法层面,囊括背景消除模块、图像特征突出等。这些可以从图像本质入手,丰富图像本身信息,去除多余噪点,为后续图像识别提供高清的图像数据,是高效率识别的基础。更有技术突破采用创新手法,如加上声音信息来协助识别,提高信息准确度。
为提高识别效率,团队研究出新的算法框架以及新的采样器,可以显著提高识别效率,大大缩短训练时间。在图像识别中,快速的识别可以提高服务质量,减少延迟,让人们感受更智能的交互。
此外,特斯联团队还解决了图像标注问题。数据标注是一个重要的过程,传统人工数据标注费时费力。团队提出了一种新的类别对比技术(CaCo),该技术在无监督域适应(UDA)任务的实例判别之上引入语义先验,可以有效地用于各种视觉UDA任务。该技术构建了一个具有语义感知的字典,其中包含来自源域和目标域的样本,每个目标样本根据源域样本的类别先验分配到一个(伪)类别标签,以便学习与UDA目标完全匹配的类别区分但域不变的表征。
与当下最先进的方法对比,简单的CaCo技术可以实现更优越的性能表现,也可以成为现有UDA方法的补充,推广到其他机器学习方法中去,如无监督模型适应,开放/部分集适应等。该技术解决了传统监督学习需要大量人工标注的问题,比现有技术拥有更高的效率。