>>所属分类 >> 机器人理论   

计算机视觉

机器人产品查询系统
与主题相关产品查询和购买: 机器人理论 计算机视觉

标签: 计算机视觉

维基百科,自由的百科全书
跳转到: 导航, 搜查
NASA火星探測車的雙攝影機系統

打算机视觉是一门研究如何使机器“看”的科学,更進一步的說,就是指用攝影機跟電腦代替人眼對目標進行識別、跟蹤跟測量等機器視覺,並進一步做圖像處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。

作为一个科学学科,打算机视觉研究相干的实际跟技巧,试图树破可能从图像或者多维数据中获取『信息』的人工智能体系。这里所 指的信息指夏農定义的,可能用来帮助做一个“决定”的信息。因为感知可能看作是从感官信号中提 取信息,所以打算机视觉也可能看作是研究如何使人工体系从图像或多维数据中“感知”的科学。

作为一个工程学科,打算机视觉寻求基于相干实际与模型来树破打算机视觉体系。这类体系的组成部分包含:

  1. 程序把持(例如产业机器人跟无人驾驶汽车)
  2. 事件监测(例如图像监测)
  3. 信息组织(例如图像数据库跟图像序列的索引树破)
  4. 物体与环境建模(例如产业检查,医学图像分析跟拓扑建模)
  5. 交感互动(例如人机互动的输入设备)

打算机视觉同样可能被看作是生物视觉的一个补充。在生物视觉范畴中,人类跟各种动物的视觉都得到了研究,从而树破了这些视觉 体系感知信息过程中所利用的物理模型。另一方面,在打算机视觉中,靠软件跟硬件实现的人工智能体系得到了研究与描述。生物视 觉与打算机视觉进行的学科间交换为彼此都带来了宏大价值。

打算机视觉包含如下一些分支:画面重建,事件监测,目标跟踪,目标辨认,机器学习,索引树破,图像恢复等。

目录

  • 1 打算机视觉的发展示状
  • 2 相邻范畴的异同
  • 3 打算机视觉的经典问题
    • 3.1 辨认
    • 3.2 活动
    • 3.3 场景重建
    • 3.4 图像恢复
  • 4 打算机视觉体系
  • 5 影響視覺系統的要件
  • 6 參考
  • 7 外部連結

[编辑] 打算机视觉的发展示状

打算机视觉与其余范畴的关联

打算机视觉范畴的凸起特点是其多样性与不完美性。

这一范畴的前驱可追溯到更早的时候,然而直到20世纪70年代后期,当打算机的机能进步到足以处理诸如图像这样的大范围数据時,打算机视觉才得到了正式的关注跟发展。然而这些发展往往来源于其余不同范畴的须要,因此何謂“打算机视觉問題”始终不得到正式定义,很天然地,“打算机视觉问题”应当被如何解决也不成型的公式。

儘管如此,人们已開始控制部分解决具体打算机视觉任务的方法,可惜这些方法通常都僅適用於一群狹隘的目標(如:臉孔、指紋、文字等),因此无奈被廣泛地利用於不同場合。

对这些方法的利用通常作为某些解决复杂问题的大范围体系的一个组成部分(例如医学图像的处理,产业制造中的品质把持与测量)。在打算机视觉的大多数实际利用当中,打算机被预设为解决特定的任务,然而基于机器学习的方法正日渐遍及,一旦機器學習的研究進一步發展,未來「泛用型」的電腦視覺應用或許可能成真。

人工智能所研究的一个重要问题是:如何让体系具备「打算」跟「决定才能」?从而使之实现特定的技巧动作(例如:挪动一个机器人通过某种特定环境)。这一问题便與打算机视觉問題息息相關。在这里,打算机视觉体系作为一个感知器,为决定供给信息。另外一些研究方向包含模式辨认跟机器学习(這也附属于人工智能領域,但与打算机视觉有侧重要接洽),也由此,打算机视觉時常被看作人工智能與打算机科学的一个分支。

物理是与打算机视觉有侧重要接洽的另一范畴。

打算机视觉关注的目标在于充分懂得电磁波——重要是可见光与红外线部分——碰到物体名义被反射所构成的图像,而这一过程便是基于光学物理跟固態物理,一些尖端的图像感知体系甚至会利用到量子力学实际,来解析影像所表示的真實世界。同时,物理学中的很多测量困难也可能通过打算机视感到到解决,例如流体活动。也由此,打算机视觉同样可能被看作是物理学的拓展。

另一个存在重要意思的范畴是神经生物学,尤其是其中生物视觉体系的部分。

在全部20世纪中,人類對各种动物的眼睛、神经元、以及与视觉刺激相干的脑部组织都進行了广泛研究,这些研究得出了一些有关“天然的”视觉体系如何運作的描述(只管仍略嫌粗略),这也构成了打算机视觉中的一个子范畴——人们试图树破人工体系,使之在不同的复杂程度上模仿生物的视觉運作。同时打算机视觉范畴中,一些基于机器学习的方法也有參考部分生物機制。

打算机视觉的另一个相干范畴是信号处理。很多有关单元变量信号的处理方法,尤其对是时变信号的处理,都可能很天然的被扩大为打算机视觉中对二元变量信号或者多元变量信号的处理方法。但因为图像数据的特有属性,很多打算机视觉中发展起来的方法,在单元信号的处理方法中却找不到对应版本。这类方法的一个重要特点,便是他们的非线性以及图像信息的多维性,以上二點作为打算机视觉的一部分,在信号处理学中构成了一个特别的研究方向。

除了上面提到的領域,很多研究课题同样可被当作纯粹的数学识题。例如,打算机视觉中的很多问题,切实践基本便是统计学,最优化实际以及多少何学。

如何使既有方法通过各种软硬件实现,或说如何对这些方法加以修改,而使之获得公道的履行速度而又不丧失足够精度,是現今電腦視覺領域的重要課題。

[编辑] 相邻范畴的异同

打算机视觉图象处理图像分析机器人视觉机器视觉是彼此周到关联的学科。假如你打开带有上面这些名字的教材,你会发明在技巧跟利用范畴上他们都有着相称大部分的重叠。这表明这些学科的基本实际大抵是雷同的,甚至让人猜忌他们是同一学科被冠以不同的名称。

然而,各研究机构,学术期刊,会议及公司往往把本人特别的归为其中某一个范畴,于是各种各样的用来辨别这些学科的特点便被提了出来。下面将给出一种辨别方法,只管并不能说这一辨别方法完全正确。

打算机视觉的研究对象重要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。打算机视觉的研究很大程度上针对图像的内容。

图象处理图像分析的研究对象重要是二维图像,实现图像的转化,尤其针对像素级的操作,例如进步图像对比度,边沿提取,去噪声跟多少何变换如图像旋转。这一特点表明无论是图像处理还是图像分析其研究内容都跟图像的具体内容无关。

机器视觉重要是指产业范畴的视觉研究,例如自主机器人的视觉,用于检测跟测量的视觉。这表明在这一范畴通过软件硬件,图像感知与把持实际往往与图像处理得到周到结合来实现高效的机器人把持或各种实时操作。

模式辨认利用各种方法从信号中提取信息,重要应用统计学的实际。此范畴的一个重要方向便是从图像数据中提取信息。

还有一个范畴被称为成像技巧。这一范畴最初的研究内容重要是制造图像,但有时也波及到图像分析跟处理。例如,医学成像就包含大量的医学范畴的图像分析。

对所有这些范畴,一个可能的过程是你在打算机视觉的实验室工作,工作中从事着图象处理,终极解决了机器视觉范畴的问题,而后把本人的成果发表在了模式辨认的会议上。

[编辑] 打算机视觉的经典问题

多少乎在每个打算机视觉技巧的具体利用都要解决一系列雷同的问题。这些经典的问题包含:

[编辑] 辨认

一个打算机视觉,图像处理跟机器视觉所共有的经典问题便是断定一组图像数据中是否包含某个特定的物体,图像特点或活动状况。这一问题通常可能通过机器主动解决,然而到目前为止,还不某个单一的方法可能广泛的对各种情况进行断定:在任意环境中辨认任意物体。现有技巧可能也只可能很好地解决特定目标的辨认,比方简单多少何图形辨认,人脸辨认,印刷或手写文件辨认或者车辆辨认。而且这些辨认须要在特定的环境中,存在指定的光照,背景跟目标姿势请求。

狭义的辨认在不同的场合又演变成了多少个略有差别的概念:

  • 辨认(狭义的):对一个或多个经过预先定义或学习的物体或物类进行辨识,通常在辨识过程中还要供给他们的二维地位或三维姿势。
  • 辨别:辨认辨认单一物体本身。例如:某一人脸的辨认,某一指纹的辨认。
  • 监测:从图像中发明特定的情况内容。例如:医学中对细胞或组织不畸形技能的发明,交通监督仪器对过往车辆的发明。监测往往是通过简单的图象处理发明图像中的特别区域,为后继更复杂的操作供给出发点。

辨认的多少个具体利用方向:

  • 基于内容的图像提取:在宏大的图像凑集中寻找包含指定内容的所有图片。被指定的内容可能是多种情势,比方一个红色的大抵是圆形的图案,或者一辆自行车。在这里对后一种内容的寻找显然要比前一种更复杂,因为前一种描述的是一个初级直观的视觉特点,而后者则波及一个形象概念(也可能说是高等的视觉特点),即‘自行车’,显然的一点就是自行车的外观并不是固定的。
  • 姿势评估:对某一物体绝对摄像机的地位或者方向的评估。例如:对机器臂姿势跟地位的评估。
  • 光学字符辨认对图像中的印刷或手写文字进行辨认辨别,通常的输出是将之转化成易于编辑的文档情势。

[编辑] 活动

基于序列图像的对物体活动的监测包含多品种型,诸如:

  • 自体活动:监测摄像机的三维刚性活动。
  • 图像跟踪:跟踪活动的物体。

[编辑] 场景重建

给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景树破一个打算机模型/三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会树破起完全的三维名义模型。

[编辑] 图像恢复

图像恢复的目标在于移除图像中的噪声,例如仪器噪声,含混等

[编辑] 打算机视觉体系

打算机视觉体系的构造情势很大程度上依附于其具体利用方向。有些是独破工作的,用于解决具体的测量或检测问题;也有些作为某个大型复杂体系的组成部分呈现,比方跟机械把持体系,数据库体系,人机接口设备协同工作。打算机视觉体系的具体实现方法同时也由其功能决定——是预先固定的抑或是在运行过程中主动学习调剂。只管如此,有些功能却多少乎是每个打算机体系都须要具备的:

  • 图像获取:一幅数字图像是由一个或多个图像感知器产生,这里的感知器可能是各种光敏摄像机,包含遥感设备,X射线断层摄影仪,雷达,超声波接收器等。取决于不同的感知器,产生的图片可能是个别的二维图像,三维图组或者一个图像序列。图片的像素值往往对应于光在一个或多个光谱段上的强度(灰度图或彩色图),但也可能是相干的各种物理数据,如声波,电磁波或核磁共振的深度,接收度或反射度。


  • 预处理:在对图像履行具体的打算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采取来使图像满意后继方法的请求。例如:
    • 二次取样保障图像坐标的正确
    • 平滑去噪来滤除感知器引入的设备噪声
    • 进步对比度来保障实现相干信息可能被检测到
    • 调剂标准空间使图像构造合适部分利用
  • 特点提取:从图像中提取各种复杂度的特点。例如:
    • 线,边沿提取
    • 部分化的特点点检测如边角检测,斑点检测
更复杂的特点可能与图像中的纹理外形或活动有关。
  • 检测/宰割:在图像处理过程中,有时会须要对图像进行宰割来提取有价值的用于后继处理的部分,例如
    • 筛选特点点
    • 宰割一或多幅图片中含有特定目标的部分
  • 高等处理:到了这一步,数据往往存在很小的数量,例如图像中经先前处理被认为含有目标物体的部分。这时的处理包含:
    • 验证得到的数据是否合乎前提请求
    • 估测特定系数,比方目标的姿势,体积
    • 对目标进行分类

[编辑] 影響視覺系統的要件

  • 光源佈局影響大需審慎考量。
  • 正確的選擇鏡組,考量倍率、空間、尺寸、失真… 。
  • 選擇合適的攝影機(CCD),考量功能、規格、穩定性、耐用...。
  • 視覺軟體開發需靠經驗累積,多嘗試、思考問題的解決途徑。
  • 以創造精度的不斷晋升,縮短處理時間為最終目標。

[编辑] 參考

  • 機器視覺
  • 人工智能与模式辨认
  • 图像处理
  • 自動光學檢查
  • 开放源代码打算机视觉库:OpenCV

[编辑] 外部連結

  • Machine Perception of Three-Dimensional Solids - the paper mentioned by Joseph Mundy in the video
  • CVonline: The Evolving, Distributed, Non-Proprietary, On-Line Compendium of Computer Vision
  • Introduction to computer vision (464KB pdf file)
  • CMU's Computer Vision Homepage
  • Keith Price's Annotated Computer Vision Bibliography and the Official Mirror Site Keith Price's Annotated Computer Vision Bibliography
  • HIPR2 image processing teaching package
  • USC Iris computer vision conference list
  • How to come up with new research ideas in computer vision? (in Chinese)
  • People in Computer Vision
  • The Computer Vision Genealogy Project
来自“http://zh.wikipedia.org/w/index.php?title=打算机视觉&oldid=18510578”
机器人产品查询系统
与主题相关产品查询和购买: 机器人理论 计算机视觉

上一篇电光快车侠2 下一篇被动行走

词条信息

ncnynl
ncnynl
超级管理员
词条创建者