前沿讲座

发布时间：2020-03-03 13:15:59 来源：范文大全收藏本文下载本文手机版

计算机视觉学科前沿知识

计算机视觉就是用计算机来模拟人的视觉系统，实现人的视觉功能，通常是指用摄像机和计算机代替人眼对目标进行识别、跟踪和测量等，从而实现对客观的三维世界的识别。人与其他动物一样，视觉、听觉、触觉等感官功能的产生，首先在于进化过程中生存的需要。根据美国心理学家Gibson的理论，人的视觉不管有多少用处，但主要功能可概括为适应外界环境和控制自身的运动。看到汽车冲过来，你会赶快回避；看到前面有激流，你不会冒然趟过去。“适应外界环境和控制自身的运动”还是比较抽象的概念。事实上，为了适应外界环境和控制自身的运动，视觉系统需要能识别物体（可想而知，一个人连亲戚、同事、朋友都不认识，会怎样生活），能判断物体的运动以及确定物体的形状和方位（否则，无法抓取物体）。所以，物体识别、物体定位、物体三维形状恢复和运动分析，就构成了计算机视觉的主要研究内容。

随着自动化水平不断的提高，机器视觉在自动化行业中应用也是越来越多，而机器视觉在我国可以说处于刚起步发展阶段，机器人视觉是一门新兴的发展迅速的学科，八十年代以来, 机器人视觉的研究已经历了从实险室走向实际应用的发展阶段。从简单的二值图象处理到高分辨率多灰度的图象处理,从一般的二维信息处理到三维视觉机理以及模型和算法的研究都取得了很大的进展。而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了机器人视觉系统的实用化和涉足许多复杂视觉过程的研究。

目前，机器人视觉系统正在广泛地应用于视觉检测、机器人的视觉引导和自动化装配领域中。在现代化的大生产之中，视觉检测往往是不可缺少的环节。比如，汽车零件的外观，药品包装的正误，IC字符印刷的质量，电路板焊接的好坏等等，都需要众多的检测工人，通过肉眼或结合显微镜进行观测检验。大量的人工检测不仅影响工厂效率，而且带来不可靠的因素，直接影响产品质量与成本。另外，许多检测的工序不仅仅要求外观的检测，同时需要准确获取检测数据，比如零件的宽度，圆孔的直径，以及基准点的坐标等等，这些工作则是很难靠人眼快速完成。近年来发展迅猛的机器视觉技术解决了这一问题。机器视觉系统一般采用CCD照相机摄取检测图象并转化为数字信号，再采用先进的计算机硬件与软件技术对图象数字信号进行处理，从而得到所需要的各种目标图象特征值，并由此实现模式识别，坐标计算，灰度分布图等多种功能。然后再根据其结果显示图象，输出数据，发出指令，配合执行机构完成位置调整，好坏筛选，数据统计等自动化流程。与人工视觉相比较，机器视觉具有精确，快速，可靠，和易数字化等优点。

机器视觉系统的输入装置可以是摄像机、转鼓等，它们都把三维的影像作为输入源，即输入计算机的就是三维管观世界的二维投影。如果把三维客观世界到二维投影像看作是一种正变换的话，则机器视觉系统所要做的是从这种二维投影图像到三维客观世界的逆变换，也就是根据这种二维投影图像去重建三维的客观世界。机器视觉系统主要由三部分组成：图像的获取、图像的处理和分析、输出或显示。将近80%的工业视觉系统主要用在检测方面，包括用于提高生产效率、控制生产过程中的产品质量、采集产品数据等。产品的分类和选择也集成于检测功能中。例如生产线上的单摄像机视觉系统，它的视觉系统用来检测生产线上的产品，决定产品是否符合质量要求，并根据结果，产生相应的信号输入上位机。图像获取设备包括光源、摄像机等；图像处理设备包括相应的软件和硬件系统；输出设备是与制造过程相连的有关系统，包括过程控制器和报警装置等。数据传输到计算机，进行分析和产品控制，若发现不合格品，则报警器告警，并将其排除出生产线。机器视觉的结果是CAQ系统的质量信息来源，也可以和CIMS其它系统集成。

由于没有通用的机器视觉照明设备，所以针对每个特定的应用实例，要选择相应的照明装置，以达到最佳效果。过去，许多工业用的机器视觉系统用可见光作为光源，这主要是因为可见光容易获得，价格低，并且便于操作。常用的几种可见光源是白帜灯、日光灯、水银灯和钠光灯。但是，这些光源的一个最大缺点是光能不能保持稳定。以日光灯为例，在使用的第一个100小时内，光能将下降15%，随着使用时间的增加，光能将不断下降。因此，如何使光能在一定的程度上保持稳定，是实用化过程中急需要解决的问题。另一个方面，环境光将改变这些光源照射到物体上的总光能，使输出的图像数据存在噪声，一般采用加防护屏的方法，减少环境光的影响。由于存在上述问题，在现今的工业应用中，对于某些要求高的检测任务，常采用X射线、超声波等不可见光作为光源。但是不可见光不利于检测系统的操作，且价格较高，所以，目前在实际应用中，仍多用可见光作为光源。

机器视觉系统中，视觉信息的处理技术主要依赖于图像处理方法，它包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后，输出图像的质量得到相当程度的改善，既改善了图像的视觉效果，又便于计算机对图像进行分析、处理和识别。图像的增强用于调整图像的对比度，突出图像中的重要细节，改善视觉质量。通常采用灰度直方图修改技术进行图像增强。图像的灰度直方图是表示一幅图像灰度分布情况的统计特性图表，与对比度紧密相连。图像的数据编码和传输，数字图像的数据量是相当庞大的，一幅512*512个像素的数字图像的数据量为256 K字节，若假设每秒传输25帧图像，则传输的信道速率为52.4M比特/秒。高信道速率意味着高投资，也意味着普及难度的增加。因此，传输过程中，对图像数据进行压缩显得非常重要，数据的压缩主要通过图像数据的编码和变换压缩完成。图像边缘锐化处理主要是加强图像中的轮廓边缘和细节，形成完整的物体边界，达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。图像分割是将图像分成若干部分，每一部分对应于某一物体表面，在进行分割时，每一部分的灰度或纹理符合某一种均匀测度度量。图像的识别过程实际上可以看作是一个标记过程，即利用识别算法来辨别景物中已分割好的各个物体，给这些物体赋予特定的标记，它是机器视觉系统必须完成的一个任务。

在本世纪

四、五十年代发展起来的线性滤波器以其完善的理论基础，数学处理方便，易于采用FFT和硬件实现等优点，一直在图像滤波领域占有重要地位，其中以WIENER滤波器理论和卡尔曼滤波理论为代表。但是线性滤波器存在着计算复杂度高，不便于实时处理等缺点。虽然它对高斯噪声有良好的平滑作用，但对脉冲信号干扰和其它形式的噪声干扰抑制效果差，信号边缘模糊。为此，1971年，著名学者TUKEY提出非线笥滤波器——中值滤波器，即把局部区域中灰度的中值作为输出灰度，并将其与统计学理论结合起来，使用迭代方法，比较理想地将图像从噪声中恢复出来，并且能保护图像的轮廓边界，不使其变模糊。近年来，非线性滤波理论在机器视觉、医学成像、语音处理等领域有了广泛的应用，同时，也反过来促使该理论的研究向纵深方向发展。

将本文的Word文档下载到电脑，方便编辑。

推荐度：

点击下载文档