首页 新闻 工控搜 论坛 厂商论坛 产品 方案 厂商 人才 文摘 下载 展览
中华工控网首页
  P L C | 变频器与传动 | 传感器 | 现场检测仪表 | 工控软件 | 人机界面 | 运动控制
  D C S | 工业以太网 | 现场总线 | 显示调节仪表 | 数据采集 | 数传测控 | 工业安全
  电 源 | 嵌入式系统 | PC based | 机柜箱体壳体 | 低压电器 | 机器视觉
收藏本文     查看收藏
 2.3

    数字图像具有一些度量和拓朴性质,与我们在基础微积分中所熟悉的连续两维函数的性质有所不同。另一个不同点在于人对图像的感知,因为对图像质量的判断也是重要的。

    2.3.1 数字图像的度量和拓朴性质

    一幅数字图像由有限大小的像素组成,像素反映图像特定位置的亮度信息,通常(从此以后我们都这样假设)像素按照矩形采样栅格布置。我们用两维矩阵来表示这样的数字图像,矩阵的无素是整数,对应于亮度范围的量化级别。

    连续图像所具有的一些明显的直觉特性在数字图像领域中没有直接的类似推广[Pavlids 77Brd and Brown 82]。距离(distance)是一个重要的例子。坐标为(ij)和(hk)的丙点间的距离可以定义为几种形式,经典几何学和日常经验中的欧氏距离(Euclidean distance)DE定义为:

    De[(ij)(hk)]=(I-h)2+(j-k)2

    欧氏距离的优点是它在事实上是直观且显然的。缺点是平方根的计算费时且其数值不是整数。

    两点间的距离也可以表示为在数字栅格上从起点移动到终点所需的最少的基本步数。如果只允许横向和纵缶的移动,就是距离D4。D4也称为“城市街区(city block)”距离,这是因为:它类似于在具有栅格状街道和封闭房子块的城市里的两个位置的距离。

    D4[(ij)(hk)]=│i-h│+│j-k│

    在数字栅格中如果允许沿对角线方向的移动,我们就得到了距离,常称这为“棋盘()”距离。距离等于国王在棋盘上从一处移动到另一处所需的步数。

    D8[ (ij) (hk) ]=max{│I-h││j-k│}

    任何距离都可以作为斜切(chamfering)的基础,在切中产生像素与某个图像子集(多半表示某种特征)的距离。所产生的图像在该子集元素位置处的像素值为0,邻近的像素具有较小的值,而远处的数值就大,该技术的命名源于这个阵列的外观。斜切在斜面匹配(chamfer matching)中有价值,将在第5.4节介绍。如下的两遍算法是基于简化了的欧氏度量导出的[Barrow et al.77],原出处是[Rosenfeld and Pfalz 68]。

    ALALBR

    ALAL

    BRBR

    ALBRBR

    图2.7斜切中使用的像素领域——像素p位于中心

    1.按照一种距离度量D,D是D4或D8对大小为M×N的图像的一个子集S做切,建立一个的数组F并进行初始化:子集S中的置为0其他置为无穷。

    2.按行遍历图像,从上到下、从左到右。对于上方和左面的邻接像素,如图2.7的AL所示的集合,设:

    F(p)= min[F(p)D(pq)+F(q)]

    q∈AL

    3.按行遍历图像,从下到上,从右到左。对于下方和右面的邻接像素,如图2.7的BR所示的集合。设:

    F(p)= min[F(p)D(pq)+F(q)]

    q∈BR

    4.数组F中得到的是子集S的斜切。

    这个算法在图像边界处显然需要调整,因为这些位置上集合AL和BR被截断了。

    像素邻接性(adjacency)是数字图像的另一个重要概念。任意两个像素如果它们之间的距离D4=1,则称彼此是4-邻接(4-neighbors)的。类似地,8-邻接(8-neighbors)指的是两个像素之间的距离D8=1。4-邻接和8-邻接参见图2.8。

    图2.8 像素邻接性

    由一些彼此邻接的像素组成的重要集合,我们称之为区域(region),这是一个重要的概念。对于熟悉集合论的读者,我们可以简单地说区域是一个连通集。更具描述性的说法是,如果我们定义从像素P到像素Q的路径为一个点序列A1,A2,……An,其中A1=PAn=Q,且Ai+1是Aì的邻接点,ì=1..n-1那么区域(region)是指这样的集合,其中任意两个像素之间都存在着完全属于该集合的路径。

    如果一幅图像的两个像素之间存在一条路径,那么这些像素就是连通的(contiguous)。因此,我们可以说区域是彼此连通的像素的集合。“连通”关系是自反的、对称的且具有传递性的,因此它定义了集合(在我们的情况下是图像)的一个分解,即等价类(区域)。

    假设Ri是“连通”关系产生的不相交的区域,进一步假定(为了避免特殊的情况)这些区域与图像的边界(是指图像矩阵中具有最小和最大标号的行和列)不接触。设区域R是所有这些区域Ri的并集,这样我们就可以定义区域R相对于图像的补集合RC。我们称包含图像边界的RC的边通子集合为背景(back-ground),而称补集合Rc的其他部分为孔(hole)1.如果区域中没有孔,我们称之为简单连通(simply contiguou)区域。有孔的区域称为复连通(multiply contiguou)。

    请注意,区域概念只使用了“连通”性。我们可以给区域赋予第二属性,这些源于对图像数据的解释。我们常称图像中的一些区域为物体(object),决定图像中哪些区域对应于世界中的物体的过程是图像分割(segmentation),将在第5章中进行介绍。

    像素的亮度是一种非常简单的性质,在有些图像中可以用于寻找物体,例如,如果一个像素比先给定的值(阈值)暗的话就属于物体。所有这样的点的连通集构成一个物体。一个孔由非物体的点组成且物体的点组成且被子物体所包围,所有其他的点就构成了背景。

    例如,白纸上印刷的黑色文本,其中字母是物体。字母包围的白色范围是孔,例如,字母O的内部。纸的其他部分是背景。

    定义在方形栅格上的邻接性和连通性造成一些悖论(paradoxe)。图2.9给出两条45O的数字线段。如果使用4-邻接,线条上的点都是不连通的。其中还显示一种与线条性质的直觉理解相盾的更的情况:两条相互垂直的直线在一种情况下(右上方)的确相交,但是在另一种情况下(左下方)却不相交,这是因为它们根本没有任何共同点(即它们的交集是空)。

    在欧氏几何学中,我们知道每个封闭的曲线(例如,一个圆)将平面分割成两个不连通的区域。如果图像数字化为一个邻接的方形栅格,我们可以从封闭曲线的内部到其外部画一条线但不与该曲线相交(参见图2.10)。这意味着曲线的内部和外部构成一个区域。这是因为线上的所有点属于一个区域。这是另一个悖论。

    解决连通性悖论的一种方法是,对物体用邻接处理,面对背景用邻接处理(或反过来)。有关二值和更多亮度级别的数字图像悖论,在[Pavlidis 77Horn 86 ]中有更为严格的处理及解决方法。

    这些问题对于方形栅格是很典型的,但是对于六边形栅格(参见图2.4)很多问题就不存在了。六边形光栅中的任何点与其6个邻接点的距离都相同。六边形光栅也有一些自身的特殊问题,比如,它很难用立叶变换来表示。

    解决连接(connectivity)性问题的另一种方法是使用基于单元复合(cell complex)的离散拓朴[Kovalevsky 89 ]。这种方法得出了一整套有关图像编码与分割的理论,其中涉及的许多问题这们在后面会遇到,比如边界和区域的表示问题。这种思想最早是Riemann在19世纪提出来的,它考虑的是不同维数的集合的族,0维的点可以赋给含有更高维结构(比如像素数组)的集合,这样可以排除我们所见到的悖论。

    考虑到简单性和易于处理,尽管存在上述缺欠,多数数字化转换器仍然使用方形栅格。

    区域的边界(border)是图像分析中的另一个重要概念。区域R的边界是它自身的一个像素集合,其中的每个点具有一个或更多个R外的邻接点。该定义与我们对边界的直觉理解相对应,即边界是区域的界限上的点的集合。有时我们称这样定义的边界为内部边界(inner border),以便与外部边界(outer border)相区别,外部边界是指区域的背景(即区域的补集)的边界。

    边缘(edge)更深一步的概念。它是一个像素和其直接邻域的局部性质,它是一个有大小和方向的矢量。边缘计算匠对象是具有很多亮度级别的图像,计算边缘的方式是计算图像函数的梯度。边缘的方向与梯度方向垂直,梯度方向指向函数增长的方向。我们在第4.3.2节将详细讨论边缘内容。

    请注意,“边界”与“边缘”是不同的。边界是与区域有关的全局概念,而边缘表示图像函数的局部性质;边界与边缘也是关联的,一种寻找边界的方法是连接显著的边缘(在图像函数上具有大梯度的点)这种方法将在第5.2节介绍。

    边缘性质隶属于一个像素及其邻域,有时评定两个像素对之间的性质也是有益的,裂逢边缘(crackedge)就是这样的一个概念。每个像素有四个裂缝边缘,由其4-邻接关系定义而得。裂缝边缘的方向沿着亮度增大的方向,是90的倍数,其幅值是相关像素对亮度差的绝对值。裂缝边缘参见图2.11,这部分内容将在第5章的图像分割中用到。

    图像的拓朴性质(topological property)对于橡皮面变换(rubber sheet transformation)具有不变性。想象一下在一个小的橡皮球表面上绘制物体的情况,物体的拓朴性质是在橡皮表面任意伸展时都具有不变性的部分。伸展不会必变物体部分的连通性,也不会改变区域中局限性的数目。Euler-Poincaré特征(characteristic)是图像的一个拓朴性质,定义为区域数与其中的孔数的差值。其他不具有橡皮面不变性的性质将在第6.3.1节介绍。

    凸包(convex hull)是用来表述物体拓朴性质的一个概念。凸包含物体的一个最小区域,该区域中任意两点之间的连线都属于本区域。例如,考虑一个形状类似于字母R的物体(参见图2.12)。想像一个细橡皮带紧绕着物体,橡皮带的形状就反映了物体的凸包。凸包的计算在第6.3.3节中描述。作

    非规则形状的物体可以用一组它的拓朴分量来表示。凸包中非物体的部分称为凸损(deficit of convexity),它可以分解为两面三刀个子集。其一是湖(lake)(图2.12中有阴影线的部分),完全被物体所包围;其二是海湾(bay),与物体凸包的边界连通。

    凸包、湖和海湾有时用来描述物体,这些特征在第6章(物体)和第11章(数学形态学)中将会用到。

    2.3.2 直方图

    图像的亮度直方图(brightness histogram)hf(z)给出图像中亮度值z出现的频率,一幅有L个灰阶的图像的直方图由具有L个元素的一维数组表示。

    1.数组hf的所有元素赋值为0

    2.对于图像f的所有像素,做hf[f(xy)]+1处理。

    前面我们曾讲过,图像可以作为随机过程实现来分析,故可以考虑一阶密度函数p1(zxy),它表示像素(x、y)的亮度值z。如果不考虑像素的位置,我们得到一个密度函数p1(z),亮度直方图就是它的估计。

    直方图通常用条状图来显示。图2.13给出了图2.3中图像的直方图。

    直方图通常是有关图像的唯一可得到的全局信息。在寻找最佳的照明条件以便抓取图像、进行灰阶度换以及将图像侵害为物体和背景这些场合,都要用到直方图。请注意,同一直方图可能对应几幅图像,例如,当背景是常数时物体位置的改变不会影响直方图。

    数字图像的直方图一般都有很多局部极小值和极大值,这会便进一步的处理变得复杂。这个问题可以通过对直方图进行局部平滑来解决,比如,可以用相邻直方图元素的局部平均来做,因此新的直方图可按下式来计算:

    h f (z)=∑hf (z+i)

    其中K是一个常量,代表平滑所使用的领域的大小。这个算法需要某种边界调整,也不能保证去除所有的局部极小。还有一些其他平滑技术,重要的有高斯模糊(Gaussian blurring),在直方图的情况下,它是2D高斯模糊[公式(4.25)]的简化,将在第4.3.3节中介绍。

    2.3.3图像的视觉感知

    我们在设计或使用数字图像处理算法或设备时,应该考虑人的图像感知原理。如果一幅图像由人来分析的话,信息应该用人容易感知的变量来表达,这些是心理物理参数,包括对比度、边界、形状、纹理、色彩等等。只有当物体能够毫不费力地从背景中区分出来时,人才能从图像中发现它们。有关人的感知原理的详细论述可以参见[Cornsweet 70Winston75Marr82Levine 85]人的图像感知产生很多错觉,了解这些现象对于理解视觉机理有帮助。其中比较为人熟知的一些错觉我们这里将提到,从计算机视觉的角度[Frisby 79]详尽地论述这一主题。

    如果人的视觉系统对复合输入剌激的响应是线性的,即是各自剌激的简单的和,问题就会相对容易些。一些剌激的衰减,即图像中物体的部分区域,可以通过亮度、对比度、持续时间来补偿。事实上,人的感知敏感度大致上是与输入信号的强度成对数关系的。在这种情况下,经过一个初始的对数变换,复合剌激的响应可以作为线性的看待。

    对比度(contrast)

    对比度是亮度的局部变化,定义为物体亮度的平均值与背景高亮度的比值。人的眼睛对亮度的敏感性成对数关系,意味着对于同样的感知,高亮度需要高的对比度。

    表观上的亮度很大程度上取决于局部背景的亮度,这种现象被称为条件对比度(conditional contrast)。图2.14给出了分别处于暗和亮背景中的两个同样亮度的小方块,人对其中的小方块感知到的亮度是不同的。

    敏锐度(acuity)

    敏锐度是觉察图像细节的能力。人的眼睛对于图像平面中的亮度的缓慢和快速变化敏感度差一些而对于其间的中等变化较为敏感。敏锐度也随着离光轴距离的增加而降低。

    图像的分辨受制于人眼的分辨能力,用比观察都所具有的更高的分辨率来表达视觉信息是没有意义的。光学中的分辨率定义为如下的最大视角的倒数:观察者与两个最近的他所能够区分的点之间的视角。这两个点再近的话,就会被当作一个点。

    人对物体的视觉分辨率在物体位于眼睛前250处。照明度在500的情况下最好,这样的照明是由400远的60灯泡提供的。在这种情况下,可以区分的两个点这间的距离大约是0.16MM。

    物体边界(object border)

    物体边界具有大量的信息[Marr 82]。物体和简单模式的边界,比如斑点或线,能引起适应性影响(adaptation effects),类似于前面讲过的条件对比度。Ebbinghaus错觉是一个人们熟知的例子,图像中心的两个同样直径的圆看起来直径不同(参见图2.15)

    色彩(color)

    由于在正常的照明条件下,人眼对色彩比亮度更敏感,因些色彩对于感知十分重要。色彩的量化和表示在第2.2.3节已经介绍过了,色彩可以表示为红、绿、蓝(RGB)三原色彩感知用HIS坐标系统来表示更好。

    色彩感知与其他心理物理量一样也受类似的适应性错觉(adaptation illusion)的影响。

    2.3.4 图像品质

    在图像的捕获、传输或处理过程中可能使图像退化,图像品质的的度量可以用来估计退化的程度。我们对图像品质的要求取决于具体的应用目标。

    估计图像品质的的方法可分为两类:主观的和客观的。主观的方法常见于电视技术中,其中最终评判标准是一组挑选出来的内行和外行观众的感觉。他们根据一张标准清单通过给出估计评分来评价图像。有关主观方法的详细内容可参见[Pratt 78]。

    度量图像品质的客观定量方法对我们更重要。理想的情况是,这样的方法同时也提供了主观的测试,且易于使用,这样晕介就可以将该标准用于参数优化。图像f(xy)的品质通常通过与一个书籍的参考图像g(xy)进行比较来估计[Rosenfeld and Kak 82]。为这一目的,常常要使用合成的图像作为参考图像。有一类方法使用简单的度量,比如均方差∑∑(g-f)2。这种方法的总是是不可能把几个大的差别与许多小的差别区分开来。除了均方差之外,还可以作用平均的绝对差或者简单的最大的绝对差。图像F和G这间的相关运算也是一种选择。

    另一类方法是测量图像中小的或最近的物体的分辨率。由黑白条纹组成的图像可以用于这一目的,这时每毫米黑白条纹对数目就给出了分辨率的大小。

    图像相似度的度量变得越来越重要了,这是因为它有助于图像数据库的检索。图片信息的度量在[Chang 89]中有论述。

    2.3.5 图像中的噪声

    实际的图像常受一些随机误差的影响而退化,我们通常称这个退化为噪声(noise)。在图像的捕获、舆或处理过程中 能出现噪声,噪声可能依赖于图像内容,也可能与其无关。

    噪声一般由其概率特征来描述。理想的噪声,称作白噪声(white noise)。具有常量的功率谱S=[参见公式(2.24)],也就是说其强度并不随着频率的增加而衰咸。白噪声是常用的模型,作为退化的最坏估计。使用这种模型的优点是计算简单。白噪声的一个特例是高斯噪声(Gaussian noise)。服从高斯(正态)分布的随机变量具有高斯曲线型的概率密度。在一维的情况下,密度函数是:

    基其中和分别是随机变量的均值和标准差。在很多实际情况下,噪声可以很好地用高斯噪声来近似。

    当图像通过信道传输时,噪声一般与出现的图像信号无关。类似的噪声也出现在老式的摄像机中。这种独立于信号的退化被称为加性噪声(additive noise),可以用如下的模型来表示:

    f(xy)=g(xy)+v(xy)

    其中 ,噪声v和输入图像g是相互独立的变量。下面的算法用来在图像中产物具有O均值的加性高斯噪声,它常常可用于测试或验证本书中的许多其他算法,这些算法是用来消除噪声或者是具有抗噪声性质的。

    1.给取一个值,它的值小时,相应的噪声也小。

    2.如果图像的灰阶范围[0G-1],计算

    p[i]=

    3.对于亮度为g(xy)的像素点(xy),产生一个位于[01]范围内的随机数qi。确定

    j=arg min(q1 – p[i])

    4.从集合{-11}中产生一个随机数q2。设:

    f*(xy)=g(xy)+q2j

    5.设:

    f(xy)=0 当f*(xy)<0

    f(xy)=G-1 f*(xy)>G-1

    f(xy)= f*(xy) 其他

    6.转到第3步,直到扫描完所有的像素。

    公式(2.47)的截断会感弱噪声的高斯性质,物别是当值与G比起来大的时候更为显著。其他产生噪声的算法可参见[Pitas 93].

    根据公式(2.46),台以定义信噪比SNR(signal-to-noise ratio)。计算噪声贡献的所有平方和:

    E=∑v2(xy)

    (xy)

    将它与观察到的信号的所有平方和进行比较,

    F=∑f2(xy)

    (xy)

    信噪比就是:

    SNR=F/E

    (严格地说,我们测量的是对应于平均误差的平均观测值,所以计算显然是一样的)。SNR是图像品质的一个度量,值越大越好。

    噪声的幅值在很多情况下与信号本身的幅值有关。如果噪声的幅值比信号的幅值大很多时,我们可以写成:

    f=g+vg=g(1+v)≈gv

    这种模型表达的是乘性噪声(multiplicative noise)。乘性噪声的一个例子是电视光栅退化,它与电视扫描线有关。在扫描线上最大,在两面三刀条扫描线之间最小。另一个乘性噪声的例子是胶片材料的退化,这是由感光乳剂有限大小银颗粒(silver grain)所引起的。

    量化噪声(quantization noise)会在量化级别不中时出现,例如,仅有50个级别的单色图像,这种情况下会出现伪轮廓。量化噪声可以被简单地消除,参见第2.2.2节。

    冲激噪声(impulsive noise)是指一幅图像被个别噪声像素破坏,这些像素的亮度与其领域的显著不同。胡椒盐噪声(salt-pepper noise)是指饱和的冲激噪声,这时图像被一些白的或黑的像素所破坏。胡椒盐噪声会使二值图像退化。

    抑制图像噪声的问题将在第4章中论述。如果对于噪声的性质没有任何先验知识,局部处理方法是合适的(参见第4.3节)。如果事先知道噪声的参数,可以使用图像复原技术(参见第4.4节)。

 

状 态: 离线

公司简介
产品目录

公司名称: 深圳市创科自动化控制技术有限公司
联 系 人: 黎友
电  话: 0755-33938285
传  真: 0755-33938285
地  址: 深圳市宝安区福永镇街道莱福大厦4楼
邮  编: 518103
主  页:
 
该厂商相关技术文摘:
激光标记和图像工业 ID 机器视觉图像处理能够节省数十万美元的成本
高精度视觉测量系统将以次微米公差检测 MEMS 的时间缩短了 90%
电池自动分拣系统
点胶控制系统
创科视觉系统简化了激光焊接技术
利用机器视觉优化太阳能生产
自动机器视觉检测在电子制造领域大显身手
工业相机CCD与CMOS区分
创科机器视觉软件功能模块更新说明
光学镜头基础知识
led芯片检测视觉定位
机器视觉典型应用
更多文摘...
立即发送询问信息在线联系该技术文摘厂商:
用户名: 密码: 免费注册为中华工控网会员
请留下您的有效联系方式,以方便我们及时与您联络

关于我们 | 联系我们 | 广告服务 | 本站动态 | 友情链接 | 法律声明 | 不良信息举报
工控网客服热线:0755-86369299
版权所有 中华工控网 Copyright©2022 Gkong.com, All Rights Reserved