首页范文计算机视觉的研究内容十篇计算机视觉的研究内容十篇

计算机视觉的研究内容十篇

发布时间:2024-04-26 01:16:58

计算机视觉的研究内容篇1

[关键词]计算机视觉;视觉框架;三维表示

中图分类号:tp338.6文献标识码:a文章编号:1009-914X(2015)47-0112-01

1计算机数字视觉技术研究的地位

长期以来,人类持续不断地试图从多个角度去了解生物视觉和神经系统的奥秘,这些努力的阶段性理论研究成果已经在人们的生产生活中发挥了不可估量的作用。计算机视觉(CV)研究的主要内容是通过计算机分析景物的二维图像,从中获得三维世界的结构和属性等信息,进而完成诸如在复杂的环境中识别和导航等任务。计算机视觉研究的重要性是不言而喻的,会产生深远的经济和科学的影响。

20世纪下半叶以来,很多研究者都曾试图通过视觉传感器和计算机软硬件模拟出人类对三维世界图像的采集、处理、分析和学习能力,以便使计算机和机器人系统具有智能化的视觉功能。今天,数字图像相关的软硬件技术在人们生活中的广泛使用,数字图像已经成为当代社会信息来源的重要构成因素,各种图像处理与分析的需求和应用也不断促使数字视觉技术的革新。数字视觉技术的应用十分广泛,如数字图像检索管理、医学影像分析、智能安检、人机交互等。

数字视觉技术是人工智能技术的重要组成部分,也是当今计算机科学研究的前沿领域,经过近年的不断发展。已逐步形成一套以数字信号处理技术、计算机图形图像、信息论和语义学相互结合的综合性技术,并具有较强的边缘性和学科交叉性。

2计算机数字视觉技术研究的核心问题

视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。如何攻克图像信息提取过程中的各种难题一直是当今计算机图像学研究的热点问题,而且在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数问题只能采用逆向推导机制,依据已知或假设的关联将视觉系统的输入数字图像和输出语义描述对应起来。基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前领域普遍采用各种统计模型和机器学习算法的本质原因。

物体的三维表示是计算机视觉研究的一个关键问题。八元树(octree)表示法是一种紧凑、简洁的物体三维表示法,近年来这种表示法被广泛地应用到计算机视觉的研究领域。广义八元树表示法的优点是不受视图个数的限制,通过增加观察方向可以计算出更加精确的物体三维表示。主要缺点是需要进行多次坐标变换,在计算机上实现时需要研究相应的离散技术。线性八元树(linearoctree)是较八元树更加简洁的表示形式。

3计算机视觉技术结构及其研究基本框架

计算机视觉技术内在的逆推机制决定了其在系统开发时必须将原始图像数据与其蕴含的知识之间的语义鸿沟加以弥补,在满足特定应用需求的前提下进行合理的图像内容简化和假设,形成目前普遍使用的计算机视觉系统结构:即图像数据层、图像特征描述层及图像知识获取层。由于各种图像特征都有其优点及不足之处目前趋势是结合不同种类的特征对图像内容进行综合表述,以建立较为可靠的图像信息模型,比如利用时空体数据结构对人体行为等视频内容进行描述。

计算机视觉技术的研究主要围绕着四个基本理论框架:以marr视觉计算理论为核心的深度重建框架;以感知特征群集为主线的基于知识的视觉框架;以“感知一动作”为基础的主动视觉理论框架;以综合集成理论为指导的视觉集成框架。其中,视觉集成理论框架是计算机视觉研究中一个较新的理论框架,并越来越多地受到cv研究者的关注。视觉集成理论的研究内容大致可以分为三个方面,第一方面的研究内容是关于视觉信息与其它类型信息的集成。第二方面的研究内容是关于视觉表示和视觉模型的集成。视觉表示方法主要分为三类:图像表示、表面表示、物体表示。视觉模型王要分为图像模型、结构和形状模型、运动和动态模型、不确定性模型。集成的视觉系统应该能够充分利用这些方法的优点。第二方面的研究内容是系统的集成。

4计算机视觉的发展历程及其趋势

一般认为,计算机视觉技术研究始于20世纪50年代中期,当时的努力主要集中在二维景物图像的分析。区别在于,图像处理的目的是通过处理原始图像得到在某一方面更有利的新图像。模式识别关心的则是将一些模式归入预先定义的有限类别中,主要研究的是二维模式。而计算机视觉主要考虑的是对三维世界的描述和理解。

一般来说,比较一致的观点认为,计算机视觉的研究起始于1965年Rboesrt开创性的工作。Rboert对“积木世界”研究取得的成功激起了人们很高的期望。

60年代末70年代初期,计算机视觉研究领域的很多工作是关于低层视觉处理,从图像中提取重要的强度变化信息――边缘检测。然而,人们很快就认识到很多重要的物体属性无法只通过分析图像的灰度变化得出。到了70年代初期,问题更加明朗化,低层视觉处理无法从单幅图像中普遍地获取对景物的有用描述,计算机视觉的研究领域普遍地发生危机。为了摆脱困境,计算机视觉迫切地需要有一个统一的理论框架作指导。70年代中期到80年代初期,计算机视觉的研究领域首次出现了一个理论框架:视觉计算理论框架,将视觉系统从概念上分成几个独立的模块。80年代后期,计算机视觉的研究领域出现了主动视觉(`vtievsiino)的理论框架。

近年的研究结果表明,单一的图像特征描述机制,无论是对底层像素级特征的描述还是顶层语义特征的描述。都仅能在有限范围内对图像的内容进行建模。巧妙融合多种图像特征因此成为近年图像信息描述方面的主要趋势,近年来,计算机视觉的另一个理论框架――视觉的集成方法越来越多地受到重视。一个重要的趋势是用于识别真实世界中较为复杂的图像内容的技术,适合描述真实场景的各种特征不断得到发展。随着目前互联网络技术的不断发展,另一个值得重视的趋势是计算机图像技术与互联网技术、社交媒体技术等其它计算机技术的融合。

6结语

计算机视觉识别技术虽然是一门新兴学科。但应用前景十分广阔,对其技术的有效性、易用性、实时性及稳定性能等方面有着较高的要求。因此。其技术面临着前所未有的机遇和挑战,该领域的发展亦有过激烈的争论和反思。但是,不可否认的是,计算机视觉技术研究在许多应用领域的应用前景都是广阔的、不可估量的。

参考文献

[1]马玉真,陶立英,王新华.计算机视觉技术的应用[J].试验技术与试验机.2006(01)

[2]潘春洪,张彩霞.计算机视觉简述[J].自动化博览.2005(05)

[3]孙瑾,顾宏斌.计算机视觉系统框架结构研究[J].计算机工程与应用.2004(12)

[4]王天珍.计算机视觉研究进展[J].武汉汽车工业大学学报.1998(01)

计算机视觉的研究内容篇2

关键词:计算机视觉;研讨式教学;小组探讨;课前回顾

作者简介:陈芳林(1983-),男,湖南株洲人,国防科学技术大学机电工程与自动化学院,讲师;周宗潭(1969-),男,河南洛阳人,国防科学技术大学机电工程与自动化学院,教授。(湖南长沙410073)

中图分类号:G643.2文献标识码:a文章编号:1007-0079(2013)26-0065-02

进入21世纪,创新型人才的培养成为各国政府和高等教育界关注的一个焦点。世界各国研究型大学的共同特点是在研究生教育阶段致力于培养富有创新意识和创新能力的高级人才。[1]研讨式教学是培养研究生创新精神、科研能力的有效途径,教师讲解与学生探讨两部分相结合是研讨式教学采用的主要模式。[2]将课程分成两部分之后,教师讲解的时间就必须压缩,教师一方面需要思考如何在较短的时间内完成课程的讲解,同时还需要考虑课程讲解要与学生探讨部分紧密结合。因此,如何上好研讨式教学教师讲解这部分课,越来越受高等院校的重视。本文针对笔者教授工科研究生课程“计算机视觉”的实践与经验,阐述了笔者对于如何上好研讨式教学教师讲解这部分课的个人体会。总结为两点:第一,首先要充分做好课程准备;第二,上课环节采取回顾—案例—小结的讲解方式。下面从课程准备、课前回顾、课程讲解、课后小结四个方面分别阐述(如图1所示)。

一、“计算机视觉”课程准备

要上好一门研讨式教学的课程,一定要结合该门课程的特点,量身定制课程内容,进行精心准备。本节先介绍“计算机视觉”课程的特点,然后结合该门课程的特点,介绍笔者对于“计算机视觉”的课程准备。

1.“计算机视觉”课程特点

“计算机视觉”是“数字图像处理”和“模式识别”等课程的后续课程。该课程重点在于图像或者图像序列的分析理解。课程知识在机器人导航、侦查、测绘、测量、精密加工和目标跟踪等多个领域都有广泛的应用。[3]近年来基于视觉信息的控制反馈也开始受到广泛关注。国内高校一般都为研究生开设了此门课程。

计算机视觉技术应用广泛、算法原理涉及面广:涉及到概率与数理统计、信号与系统、图像等基础知识。“计算机视觉”是一门重要的控制类、电子类及计算机类专业研究生的选修课程,它内容广泛、综合性强,研讨能力的培养显得非常关键。

2.课程准备

首先,结合“计算机视觉”课程内容广泛、技术日益更新和丰富的特点,将课程36学时分为12次课,每次课为3小时,每堂课教师讲解一个专题。这种设计,一方面可以更广地涉及计算机视觉的各个领域;另一方面以专题的形式来讲解,可以将学生带入到该专题,介绍基本背景、理论、知识和方法,让学生有一个初步的了解,方便课后学生对感兴趣的专题进一步深入挖掘与研究。

其次,在课程开始之前,教师仔细统筹,安排好每次课的专题,这样既方便学生一开始对整个课程有一个整体的了解,也方便学生选择课堂研讨的题目与内容。根据12个专题,将各个专题讲解的内容与课件在开课之前准备好,这样有利于把握各个专题之间的前后承接关系。例如,“区域”与“分割”是既有区分又有联系的两个专题,在课程开始之前,将课件准备好,就有利于宏观把握,在“区域”专题提到的分割算法,就不需要在“分割”专题再次重复,而在“分割”专题可以结合前面“区域”专题进行互相补充,以帮助学生融会贯通。

最后,在每个专题上课之前,再对课件进行精雕细琢,主要是对内容分好层次,对方法进行分类,力图在较短的时间内,让学生对该专题有较全面的认识。例如,在讲解图像分割时,由于图像分割方法非常多,可以将分割方法分为若干个大类,每个大类只讲1~2个方法。这样既可以尽可能涉及更广的领域,又可以提高讲解的效率。

二、“计算机视觉”课前回顾

课前回顾是指每堂课的前面一小段时间用来回顾上一堂课的内容。虽然课前回顾时间非常短,一般为3~8分钟,但是课前回顾是课堂教学中的一个重要环节。课前回顾可以帮助学生加强将要学习的内容与已学过内容之间的联系。通过课前回顾,学生可以回忆前续课程所讲解的概念、理论、算法的步骤等内容,有助于解决新问题或者理解新知识。

课前回顾最重要的是既要复习前续课程的内容,又要注意将前续内容与当前内容联系起来。由于讲解时间有限,要使研讨式教学的教师讲解部分效率高,教师帮助学生回忆上堂课的概念、模型、算法等内容,就变得非常重要。如果不做课前回顾,那么当讲到某处新知识时,往往需要停下来,将前续课程再讲一遍,否则学生无法理解新的知识,这样就降低了教学的效率。

课前回顾的时间,一般以3~8分钟为宜。课前回顾的形式可以多样化,如讲解课后作业、回顾概念、提问等。笔者认为应根据当天课程与前续课程的关系,采取合适的方式。各种方式结合使用,提高课前回顾的效率。

三、“计算机视觉”课程讲解——案例教学

案例教学已经成功地应用于数学、计算机科学等领域的教学。通过案例,学生可以很快地掌握相应的概念、算法的步骤等,从而提高教师讲解部分的效率。[4]例如,在讲解马尔科夫随机场时,笔者通过案例式教学,将马尔科夫随机场用一个生活中的例子来向学生解释。首先,将马尔科夫随机场分解成两个重要的概念,分别是随机场与马尔科夫性,然后将它们对应到例子中,帮助学生理解。

随机场包含两个要素:位置(site)和相空间(phasespace)。当给每一个“位置”中按照某种分布随机赋予“相空间”的一个值之后,其全体就叫做随机场(如图2(a))。[5]这个概念非常抽象,难以理解。笔者应用案例式教学,拿庄稼地来打比方。“位置”好比是一亩亩农田,“相空间”好比是种的各种庄稼。给不同的地种上不同的庄稼,就好比给随机场的每个“位置”,赋予“相空间”里不同的值。所以,可以形象地理解随机场就是在哪块地里种什么庄稼的布局(如图2(b))。

马尔科夫性指的是一个随机变量序列按时间先后顺序依次排开时,第n+1时刻的分布特性,与n时刻以前的随机变量的取值无关。为了更直观地理解马尔科夫性,笔者仍然拿庄稼地打比方,如果任何一块地里种的庄稼的种类仅仅与它邻近的地里种的庄稼的种类有关,与其他地方的庄稼的种类无关,这种性质就是马尔科夫性。

符合上述两个特征,那么这些地里种的庄稼的集合,就是一个马尔科夫随机场。通过案例式教学,笔者发现可以加深加快学生对课程内容的理解,提高教师讲解环节的效率。

四、课后小结

课后小结指的是一堂课将要结束时,教师对本堂课进行一个简短的总结。许多成功的教师都会在其教学中坚持课后小结这个环节,给学生一个总体的印象,以帮助学生消化本次课程的内容。

研讨式教学教师讲解部分的课后小结与普通教学方式应有所区别。笔者认为这主要是因为通过课后小结可以将本次课程所讲内容与学生的研讨环节结合起来,而不仅仅是对内容进行简单的总结。

为了达到课后小结使本次课程内容与学生探讨环节建立联系的目的,笔者在教学中常采用如下方式:首先,像普通教学方式一样,总结本次课程内容;然后,在此基础上,抛出若干问题,这些问题,不需要学生马上解答,而是留给学生课后思考,提供他们选择研讨主题的素材;最后,介绍其他在本次课程中没有涉及到的前沿知识、方法与理论,拓宽学生的视野,从而增加学生选择探讨主题的覆盖面。

通过应用这种方式,笔者发现学生的思维更开阔,在探讨环节,学生往往可以选择一些比较新颖的主题(例如视频中不动点的检测等),而不仅仅局限于教师所讲内容,从而提高了研讨式教学的效果。

五、结论

在“计算机视觉”课程中引入研讨式教学,通过总体设计规划好整门课程内容,课堂讲解注意采用回顾—案例—小结的方式,笔者对如何上好研讨式教学教师讲解这部分课进行了个人经验的总结。通过本次教学改革,笔者体会到如果要提高教学效果,一定要注意教师讲解与学生探讨两个环节的紧密结合。

参考文献:

[1]侯婉莹.我国研究型大学本科生科研研究[D].济南:山东大学,

2009.

[2]张晴,李腾,韦艳,等.研讨式教学模式的理论研究[J].中国科技纵横,2011,(10).

[3]D.H.巴拉德.计算机视觉[m].北京:科学出版社,1987.

计算机视觉的研究内容篇3

关键词:计算机软件;课程教学;CorelDRaw

中图分类号:J05文献标识码:a文章编号:1005-5312(2013)24-0161-02

一、计算机软件CorelDRaw的课程教学目标

根据视觉设计专业人才培养方案,计算机软件CorelDRaw的课程教学目标为,熟练掌握软件的操作技巧,能够运用CorelDRaw软件绘制艺术化的矢量图形图标和编排有艺术效果的图文版面。

二、计算机软件CorelDRaw课程教学中的常见问题

CorelDRaw是一款专业的矢量图形绘制软件,有强大的矢量图形绘制功能和便捷的图文编排工具。目前课堂教学中常见的问题主要集中在,一是没有根据所学专业详略得当地安排教学内容,每种工具命令都泛泛而讲,不利于学生对重点知识的熟练掌握和深入探究;二是课堂练习安排没有层次性和趣味性,重复枯燥的练习不仅磨灭学生的学习积极性,也扼杀了学生的创造力;三是学习效果反馈缺乏及时性和针对性,没有因材施教的课堂不能保证教学的质量和效率。

三、视觉设计专业的计算机软件特色课程模式研究——以CorelDRaw课程教学为例

根据教学中存在的问题进行课程模式的思考探索,认为课程教学第一个关键点是要有专业针对性,要根据视觉设计专业重点运用的领域安排教学内容和组织课堂教学,所以提出针对性强、循序渐进和因材施教的渐层型课程模式;第二个关键点是要有教学效率和教学效果,所以提出能激发学生专业热情和培养学生专业能力的效能型课程模式。

(一)渐层型课程模式——关于课程内容学习的探索与实践

“渐层型课程”是指在本专业计算机软件教学中,教师引导学生进行循序渐进不同层次的迁移应用和绘制要求,其理论依据是斯金纳(BurrhusSkinner)程序教学模式,这种教学模式具有极强的操作性,有利于学生系统掌握知识和技能、循序渐进地学习,并能及时反馈强化所学知识,同时培养学生的自学能力。

1.渐层型课程模式专业针对性强

渐层型课程模式的构建思路是针对专业特点来设置教学内容和用80%的时间熟练掌握20%的重点知识。

视觉设计专业学生的核心课程一般为文字设计、版式设计、海报设计、书籍设计、包装设计和品牌推广等,所以CorelDRaw课程教学,应将这些设计类别需要用到的计算机辅助领域作为教学重点,用80%的课程时间来熟练掌握视觉设计专业辅助设计常用到20%的重点知识,并将后续专业学习的实际设计项目作为课堂练习和考核的重点内容。

2.渐层型课程模式遵循渐进规律

在CorelDRaw课程教学中,教师通过知识新授、牵扶帮学和延伸自学来循序渐进安排课程教学,能有效优化课堂教学质量。

知识新授环节要注重培养学生对指定目标的学习能力,首先以温故知新和思维启发为切入点,用三遍不同层次的讲解演示和学生独立操作相配合来达到新授、巩固、强化重点难点的学习效果。

牵扶帮学教学阶段根据具体实际情况,可以通过教师出示图文说明的操作提示帮助学生掌握重点和突破难点,也可以通过放手学生独立操作后的师生共同讨论及解题新思路的探索来深化学生的操作技术。

延伸自学的教学阶段要善于创设自学延伸的学习情境。具体措施有:在自学基础上进行举一反三的延伸学习;也可以先不看教程自学探索,之后再将自己的操作和教程操作进行对比分析来深化对技巧的理解;或者提供高质量的图形案例和更多自学网站自学书籍的信息,让学生在更加深广的学习情境中充满学习热情地自由驰骋。

3.渐层型课程模式注意因材施教

因材施教的课堂实施手段主要包括:一是教师逐个当堂反馈学习效果,这利于调动学生学习积极性、有利于教师掌握学生实际学习能力来与学生开展良性互动、有利于落实学生的当堂学习情况集中讲解容易出现的问题,保证教学质量;二是分层次针对有差异的个体开展学习引导,这能有效避免有的学生觉得练习太容易,完成后无事可做,有的学生则畏难不愿学习,失去学习兴趣的情况;三是根据个体差异来设置具备必选标准性和可选自由性的作品考核形式,能更真实地考核学生实际操作能力,激发学生的学习主动性,还能再一次大幅度提升学生软件操作技巧,为后阶段的专业课程学习和毕业设计积累丰富的计算机造型技术。

4.渐层型课程模式的实践效果

渐层型课程模式首先从课程内容安排上体现出针对性强和重点突出的渐层性,其次在课堂教学中体现出循序渐进符合学生认知规律的渐层性,最后在课堂教学反馈和课程考核差异性设置中体现出渐层性,渐层型课程模式由浅入深,由表及里,让CorelDRaw的课程教学充满学习的乐趣和努力的进阶,学生不仅能学会课程知识,还能提高举一反三的思维水平和开发探索研究的自学潜能。

(二)效能型课程模式——关于专业素质养成的探索与实践

采取效能型课程模式来进行CorelDRaw的课程学习,是关于专业素质养成的探索与实践。根据奥苏贝尔(Davidausubel)有意义的接受型学习教学理论和先行组织者教学模式,提出视觉设计专业计算机软件的教学特色研究方向“效能型课程”模式,是指高效高能的课程模型,“高效”即课堂效率高,“高能”即学生能力强。

视觉设计专业的学生要具备高素质的专业素养和独特的创意能力,计算机软件教学在培养学生专业能力,掌握数码造型技术的同时,也应该注意激发学生的专业热情。

1.效能型课程模式能激发学生的专业热情——高效

简化创作流程和细化制作任务这两种教学措施能有效提高计算机软件教学的课堂效率,让学生乐学愿学,从而激发学生对本专业的学习热情和学习期待。

简化制作流程是简化学生概念创意的难度,但同时又给予学生根据设计实例自由发挥的空间,不仅能保证作品的视觉美观度,还能有效启发学生的设计创造力和对专业的学习热情。二年一期的学生并没有进入核心设计课程的学习,所以不具备很专业的设计创意能力。在CorelDRaw的课程学习中,如果按照一般的创作流程,让学生先创意再画草图,然后制作电子稿,不仅和其他类型课程的考核内容重复,也没有达到计算机软件以技术考核为主的课程重点,同时学生因为没有很好的创意和设计技巧,即使软件操作能力很强,绘制的作品也往往不具备一定程度的审美水平,视觉效果不美观的软件绘制作品会夸大学生现阶段较薄弱的设计能力,这种挫败感往往伤害到学生对视觉设计专业的热情。所以,通过简化创意过程,强调制作技术和对已有案例进行延续设计的作品考核方式,能在保证作品审美水平的前提下更大程度激发学生探索运用软件设计制作的学习热情。

细化制作任务能保证学生一步一步落实学习目标,最终高质量完成学习任务。以课程考核为例,将制作Vi手册这个整体目标,逐个分解细化,每个任务难度合理把握在学生跳一跳能完成的程度,学生通过一次次努力累积最终如期完成体现自己最大制作能力的课程考核作品,这一学习过程能极大鼓舞学生的学习热情和对专业设计课程的期待与向往。

2.效能型课程模式能培养学生的专业能力——高能

在计算机软件的课程学习中培养学生专业能力主要有两种教学措施,一是强化重点知识,二是深化操作技巧。

强化重点知识要求不仅是课程作品考核,包括整个课堂讲授和课堂练习都要围绕这些操作重点合理设置,展开教学。CorelDRaw的工具命令进行初级操作比较简单,但是熟练掌握就需要反复练习和不断强化,而要达到灵活运用的程度则需要通过恰当的教学方法进行引导,才能真正深化学生的操作技巧。

深化操作技巧主要运用对比分析、迁移应用等教学措施来实现。如特效文字的操作技巧就是用对比分析法来深化学生对操作技巧的理解,案例用一段文字和正圆形的融合为切入点,运用不同的工具编辑文字和正圆,能产生多种不同的视觉效果,通过对比分析能有效深化学生的操作技巧。再如用三种软件绘制同一对象的练习,就是采取迁移应用的教学方法来弱化学生对画面变化的关注度,从而增强学生对软件工具深入理解和综合应用的关注度。深化学生对重点工具的探索运用还可以用系列案例剖析、不同案例对比、案例自学和已有案例延续设计等教学手段来实现。

3.效能型课程模式的实践效果

效能型课程模式的具体教学实践环节不仅能使学生熟练基本操作知识,提升重点制作技巧,同时还能协调学生软件制作能力和实际创作水平的差异,提高课堂效率,潜移默化为学生铺垫良好的审美趣味和准确的专业素养,增强专业课程的整体持续性和纵向联系度。

四、视觉设计专业计算机软件特色课程模式探索与实践研究的意义和作用

(一)对本门课程产生的意义和作用

综上所述,计算机软件特色课程模式——渐层效能型课程研究是针对视觉设计专业学生的软件学习现状提出的,在CorelDRaw的课程教学实践中,呈现专业特色突出,课堂操作可行,教学效果明显的实际应用意义。

(二)对横向课程产生的意义和作用

视觉设计专业学生需要掌握的计算机软件包括4门静态图像造型软件和2门动态图像造型软件。视觉设计专业计算机软件特色教学研究项目——渐层效能型课程模式,能规范本专业多门计算机软件课程的整体教学模式,能提高学生的学习效率,缩短学习周期。

(三)对纵向课程产生的意义和作用

渐层效能型课程模式能继续深化纵向的课程延伸,以儿童视觉产业为例,渐层效能型特色课程模式可以纵向应用在儿童产品软件课程的教学中,并进一步发展延伸到儿童产品设计的媒体技术开发中。

五、结束语

视觉设计专业计算机软件特色课程模式——渐层效能型课程模式,构建了视觉设计专业计算机软件教学的有机课程体系,提供了规范的课程模块,同时为视觉设计专业其他课程开拓了更多横向和纵向的教学研究方向。

注:1.本文为长沙师范学院课题项目经费支持,项目名称为:视觉设计专业计算机软件教学特色研究——渐层效能型课程模式,编号:XXZD201105;2.本文为湖南省教育科学“十二五”规划项目研究,名称为:基于数码造型平台的艺术设计类课程有效教学研究。

参考文献:

[1][捷克]夸美纽斯.大教学论[m].傅任敢译.北京:人民教育出版社,1984.

计算机视觉的研究内容篇4

关键词:计算机视觉技术;食品工业;分级;图像处理

中图分类号:tS207文献标识码:a

随着微型个人计算机应用的越来越广泛,以及计算机在综合学科中应用的深入研究,现如今在工农业、军事国防、医学卫生等众多领域的使用和研究方面计算机视觉技术都起到了至关重要的作用,为了节省人力、降低成本、减少误差,该项技术在食品企业、科研院所、检测机构中的应用更加普遍。如今,在农产品药物残留检测、水果重量分级、等级筛选、质量监管等方面计算机视觉技术有众多应用。

1计算机视觉技术概述

计算机视觉技术是利用计算机、摄像机、图像卡以及相关处理技术来模拟人的视觉,用以识别、感知和认识我们生活的世界[1]。该技术是模拟识别人工智能、心理物理学、图像处理、计算机科学及神经生物学等多领域的综合学科。计算机视觉技术用摄像机模拟人眼,用计算机模拟大脑,用计算机程序和算法来模拟人对事物的认识和思考,替代人类完成程序为其设定的工作。该技术由多个相关的图像处理系统组成,主要包括光源提供系统、图像提取系统、计算机数据运算系统等。原理是:首先通过摄像机获得所需要的图像信息,然后利用信号转换将获得的图像信息转变为数字图像以便计算机正确识别[2]。随着科学技术的发展,计算机技术在各个领域得到广泛应用,计算机视觉技术不仅在代替人类视觉上取得了重大成就,而且在很多具体工作方便超越了人的视觉功能。计算机视觉计算有如此快速的发展,是因为与人类的视觉相比该技术具有以下显著优势[3]。

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚多达20a,但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图像处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和Bet算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。mertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量中的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BaRDot)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征,识别出微生物数量,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。Gokmen,V等通用对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率也关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大。例如,Davenel等通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花粤和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。nozer等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是同一套系统和设备很难用于其他种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。majumdar.S等利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

现阶段的计算机视觉技术和配套的数学模型适用于简单的环境,在复杂环境下工作时会产生较大的误差。plebe等利用计算机视觉技术对果树上的水果进行识别定位,但研究发现由于光照条件以及周边环境的影响,水果的识别和定位精度不高,不能满足实际生产的需要。

综上所述,可看出国内外学者对计算机视觉技术在食品工业中的应用进行了大量的研究,有些研究从单一方面入手,有些研究综合了多个学科,在研究和应用的过程中,取得了较大的经济效益,也遇到了很多问题,在新的形势下,计算机视觉技术和数码拍摄、图像处理、人工神经网络,数学模型建设、微生物快速计量等高新技术相融合的综合技术逐渐成为了各个领域学者的研究热点,以计算机视觉为基础的综合技术也将在食品工业中发挥更加重要的作用。

参考文献

[1]宁纪锋,龙满生,何东健.农业领域中的计算机视觉研究[J].计算机与农业,2001(01):1-3.

[2]李峥.基于计算机视觉的蔬菜颜色检测系统研究[D].吉林:吉林大学,2004.

[3]曾爱群.基于计算机视觉与神经网络的芒果等级分类研究[D].桂林:桂林工学院,2008.

[4]韩伟,曾庆山.基于计算机视觉的水果直径检测方法的研究[J].中国农机化,2011(05):25-29.

[5]李庆中.苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D].北京:中国农业大学,2000.

[6]孙洪胜,李宇鹏,王成,等.基于计算机视觉的苹果在线高效检测与分级系统[J].仪表技术与传感器,2011(06):62-65.

[7]刘禾,汀慰华.水果果形判别人工神经网络专家系统的研究[J].农业工程学报,1996,12(0l):171-176.

[8]应义斌,景寒松,马俊福.用计算机视觉进行黄花梨果梗识别的新方法[J].农业工程学报,1998,14(02):221-225.

[9]杨秀坤,陈晓光,马成林,等.用遗传神经网络方法进行苹果颜色白动检测的研究[J].农业工程学报,1997,13(02):193-176.

[10]陈育彦,屠康,柴丽月,等.基于激光图像分析的苹果表面损伤和内部腐烂检测[J].农业机械学报,2009,40(07):133-137.

[11]冯斌,汪憋华.基于计算机视觉的水果大小检测方法[J].农业机械学报,2003,34(01):73-75.

[12]朱伟,曹其新.基于模糊彩色聚类方法的西红柿缺陷分割[J].农业工程学报,2003,19(03):133-136.

[13]曹乐平,温芝元,沈陆明.基于色调分形维数的柑橘糖度和有效酸度检测[J].农业机械学报,2009,41(03):143-148.

[14]刘刚,王立香,柳兆君.基于计算机视觉的苹果质量检测[J].安徽农业科学,2012,40(08):5014-5016.

[15]BlascoJ,aleixosn,moltoputervisiondetectionofpeeldefectsincitrusbymeansofaregionorientedsegmentationalgorithm[J].JournalofFoodengineering,2007,81(03):535-543.

[16]赵广华,飞,陆奎荣,等.智能化苹果品质实时分选系统[J].中国科技信息.

[17]王江枫,罗锡文,洪添胜,等.计算机视觉技术在芒果重量及果面坏损检测中的应用[J].农业工程学报,1998(12):186-189.

[18]欧阳静怡,刘木华.基于计算机视觉的鸡蛋裂纹检测方法研究[J].农机化研究,2012(03):91-93.

[19]汪俊德,郑丽敏,徐桂云,等.基于计算机视觉技术的双黄鸡蛋检测系统研究[J].农机化研究,2012(09):195-199.

[20]郑丽敏,杨旭,徐桂云,等.基于计算机视觉的鸡蛋新鲜度无损检测[J].农业工程学报,2009,25(03):335-339.

[21]潘磊庆,屠康,詹歌,等.基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J].农业工程学报,2010,26(11):332-337.

[22]mertensK,DeKetelaereB,KamersB,etal.Dirtdetectiononbrowneggsbymeansofcolorcomputervision[J].poultryScience,2005,84(10):1653-1659.

[23]殷涌光,丁筠.基于计算机视觉的食品中大肠杆菌快速定量检测[J].吉林大学学报(工学版),2009,39(02):344-348.

[24]LawlessC,wilkinsonDJ,Younga,etal.Colonyzer:automatedquantificationofmicro-organismgrowthcharacteristicsonsolidagar[J].BmCBioinformatics,2010(08):38-44.

[25]郭培源,毕松,袁芳.猪肉新鲜度智能检测分级系统研究[J].食品科学,2010,31(15):68-72.

[26]BayraktarB,Banadapp,HirlemaneD,etal.Featureextractionfromlight-scatterpatternsofListeriacoloniesforidentificationandclassification[J].JournalofBiomedicaloptics,2006,11(03):34-36.

[27]殷涌光,丁筠.基于计算机视觉的蔬菜中活菌总数的快速检测[J].农业工程学报,2009,25(07):249-254.

[28]鲁静.乳品微生物自动检测系统的设计[J].湖北第二师范学院学报,2010,27(08):115-117.

[29]刘侃.鲜奶含菌量快速检测系统[D].华中科技大学,2008.

[30]里红杰,陶学恒,于晓强.计算机视觉技术在海产品质量评估中的应用[J].食品与机械,2012,28(04):154-156.

计算机视觉的研究内容篇5

关键词:智能视频监控;目标跟踪;运动分割;图像标定

中图分类号:tp311文献标识码:a文章编号:1009-3044(2012)35-8499-03

1 概述

在人类的活动所涉及的各种信息中,以视觉信息所占是比重最大。人类主要依靠视觉系统来形成记忆。计算机视觉系统便是模拟人类视觉系统的某些功能,用摄像机和电脑代替人眼对目标进行识别、跟踪、测量,实现计算机对三维景物世界的理解。计算机视觉是计算机科学和人工智能的一个分支,目前既是工程领域也是科学领域里一个极富有挑战性的研究项目,它的实现,将给相关重要应用领域,如制造业、医疗诊断、检验以及军事领域中的智能、自主系统等,带来质的改变。近三十年来,计算机视觉技术已经取得了突飞猛进的进展,它的巨大应用前景将使得这种发展势头继续保持相当长的时期。

计算机视觉是通过运用各种成像系统代替人的视觉器官实现成像输入的,再由计算机来代替大脑完成对视频图像的分析和处理。目前有两种技术途径可以实现计算机的智能视觉效果,一个是仿生学方法,另一个是工程方法。仿生学是从分析人类视觉入手,通过对人类视觉成因原理的了解,参考人类视觉建立一个计算模型,用计算机系统将所有的过程和结果一一重现。由于这种技术方法目前还有许多难题需要破解,进展十分缓慢,因此更多的考虑采用工程方法。工程方法脱离了人类视觉系统的种种条框,从另一个角度寻找各种可行的技术方法实现计算机的视觉功能。

对于人类来讲,视觉系统虽然是获取信息的途径中占比最大的,但是,其他获取信息的通道也是必不可少的。在人类的智能系统中,感知行为是通过各个通道分别获取信息,然后汇集起来,使人类获得一个全面的感知。每个通道所获取的信息对于事物的理解或许是不全面的,但是,将所有的信息通道所获取的信息进行总和后却是可以得到一个相对完整的认识的。以前所研究的比较初级的人工智能系统就犯了以偏概全的毛病,希望通过独立运行一个完美的功能子系统就能获取所有的信息。为了达到这样一个目的,不得不去人为施加种种约束条件,或者造一些脱离实际的理想数据,结果可想而知。我们在研究计算机视觉系统的可行性方法的时候,也要认识到计算机视觉只是人工智能的一部分,它的功能是不能够孤立实现的,必须结合不同的应用背景,与不同的感知通道相互配合,综合达到智能视觉监控系统的目的。例如,计算机视觉系统运用在通信中,应与语言通道想配合;在发现和跟踪目标的应用中就要注意和激光和超声波等非视觉技术配合等。目前,关于计算机视觉的理论还不是太完善,但是相关的应用已经先行一步,该文对计算机视觉系统方面的实际运用方面进行了研究。

2 计算机智能视频健康概述

2.1计算机智能视频监控研究现状

计算机视频监控是通过计算机视觉和图像处理来完成对目标的一系列监控目的,比如运动检测、运动目标跟踪、目标分类以及目标行为的描述与理解等。将这些监控目的进一步划分,其中运动目标的类与跟踪、运动检测是近年来视频监控领域里研究较多的项目,也是属于视觉处理中低级和中级的部分;而高级部分是行为的描述和理解,这也是业内近年来较多受到关注的研究热点,它代表了监控行业未来的发展方向,也是信息产业的未来发展趋势。由于它巨大的应用前景,产业界、学术界和各级管理部门都对它给予了高度重视,其中蕴藏着的巨大商机和所带来的经济效益更为人们津津乐道。

人们可以运用计算机智能视频监控系统对拍录到的图像序列进行自动分析,它特有的计算机视觉和视频分析技术可以自动完成这个过程,不需要人为进行过多干预。这样,就可以在很大程度上解决“他们正在做什么”、“他们将会做什么”的问题,而后,人们通过进一步的决策推理过程对“我们可以采取什么问题”的疑问给出答案。目前,社会上发起的平安城市等大型项目已经给智能视觉系统的应用提供了可供借鉴的方向,同时,还可以扩展到人流量统计、监控偷油行为、入侵行为等,这些需要用到智能识别系统的项目都使得人们逐渐对计算机智能视频监控系统重视起来。

2.2计算机智能视频监控系统与运动目标检测技术

目标的运动检测是一项相当困难的工作,这是因为背景图像中往往还存在一些动态变化的影响,如影子、光照、遮挡、混乱干扰以及天气等。这些因素的干扰使得人们很难将运动变化的区域从背景图像中提取出来。直接影响了对目标的分类、跟踪和行为理解等后期处理。目前,常用了运动目标检测技术有背景减除、时间差分、Rosenblum等。

2.3计算机智能视频监控与运动目标跟踪技术

2.3.1运动分割

动态环境中捕捉到的运动目标图像大多受到各种不确定因素的影响,如影子、物体之间或者与环境之间的遮挡、摄像机的运动、光照条件的变化等,这些都给准确有效的运动分割带来困难。但是,快速准确的运动分割是一个相当重要的环节。就拿影子的干扰来说,若是影子与与检测目标分离,容易引起误会,将影子误认为是场景中的目标;若是影子与目标相连,则会扭曲了目标的形状,使得基于形状的目标识别方法不再可靠。目前主要采用的是背景减除法,这种方法的适用范围有限。人们目前还没有找到对于任何复杂环境中的动态变化均有适应性的处理模型。研究者们试着运用时空统计的方法构建自适应的背景模型,也许对于那些不受限于环境的运动分割而言是个好方法。

2.3.2目标跟踪的分类

2.3.2.1根据目标跟踪与目标检测的时间关系可分为三类

一是先检测后跟踪,而是先跟踪后检测,三是边检测边跟踪。

2.3.2.2根据目标跟踪的所采取的策略来分,有3D和2D两种

3D的方法是在一个由基于坐标系构筑的三维立体世界内进目标进行跟踪,2D则是在一个二维平面内对目标进行锁定跟踪。2D的方法所需处理的数据较少,跟踪操作速度较快,但是,对于遮挡问题无能为力。

2.3.3跟踪方法细分

2.3.3.1基于特征的跟踪方法

不管是刚体运动还是非刚体运动,在一序列图像中,相邻的两帧图像中,由于采样时间间隔十分短,在视觉上差别微小,可以认为是这些个体特征在形式上具有平滑性。

2.3.3.2基于主动轮廓的跟踪方法

用参数表示轮廓线,运用目标的边缘特征提供运动方式、物体形状之外的其他目标信息。

2.3.3.3基于运动估计的跟踪方法

运用运动估计技术对目标进行分割和跟踪是一种常用的做法。

2.4 图像标定

由目标在图像坐标系下的坐标来求得在世界坐标系下的坐标,称之为图像标定。通常是根据摄像机的内外参数来实现的,简称为摄像机标定。这种方法中,需要注意的是摄像机所得到的图像投影容易受到几何形变的影响,这样在建模的时候,导致精度不够。像平面与所拍摄的物平面上的两条平行线,在图像上就可能是两条相交的直线。一个匀速运动人,想要在图像坐标系下计算出其速度。但是,在近距离拍摄时,测得的速度快,远距离拍摄的时候,测出的速度慢。在进行目标跟踪之前,对目标进行良好的图像标定,可以使目标的动态特性建模效果更加精确。

2.5 计算机智能视频监控技术难点

数字化、智能化是视频监控系统的未来发展趋势。目前,视频监控系统系统智能化还需面对许多问题,这些问题大多源于计算机视觉技术方面。

2.5.1从实际情况来看

视频监控系统需要面对一个十分复杂且不断变化的应用环境,这给计算机视觉技术的应用带来了更高的要求,要求能够自动、连续地工作,才能将目标从复杂环境下的分离、结构出来,从而进一步完成其他分析工作。

2.5.2其次,运动目标本身具有多样性的特征

如何使这些目标摆脱客观环境的限制,将目标的变化区域从背景图像中提取出来,从而目标进行运动分析、分类,尤其是对非刚性目标运动进行跟踪、行为理解还是相当困难的,这也是智能视频监控系统领域里近年来研究的重点。

2.5.3若是监控的范围扩大,就需要大量的摄像机进行协同工作

但是,实现多台摄像机对运动目标连续、一致的视觉分析还非容易之事。

2.5.4目前该领域内还产生了建立视频数据库的想法

系统通过这样的方法实现海量视频信息的存储、检索和查询,这方面也是近年来研究的热点,目前还处于起步阶段。距离视频监控系统的智能化目标还有相当长的路要走。

2.6计算机智能视频监控应用前景展望

2.6.1 人数统计

在许多人流量大的地方都有人流量统计的需求,如火车站、广场等。这时候目标以人头为基本计算单位,对人头的检测和跟踪是主要技术要求。实际上这种检测轮廓非常重要。

2.6.2 车流量统计

在许多路口,交通部门对车流量也需要有个大概统计,许多地方的车流量可以通过其他检测手段检测,视频图像是最快和较为准确的一种方式。

2.6.3 遗留物检测

自911事件发生以来,全球对于公共安全的意识日益重视,各国纷纷采取多种措施防范恐怖主义袭击,例如加强出入口管制、随身行李检查、增加警备人员数目、追踪可疑人士的行径等。其中,监控系统扮演了非常重要的角色,特别是在车站、机场、大型商场等人口密集的地区,一旦发生炸弹引爆等恶意袭击事件,后果不堪设想。为了及早防范,监控系统需要采用具备遗留物侦测的智能分析系统,对可疑滞留物品实行及时通报和处理。 另外,遗留物侦测也可以用来解决自动提款机(atm)的安全问题。部份不法份子会在atm加设卡片阅读机或贴上误导性信息,达到骗取钱财的目的,设置遗留物侦测系统可以及时发现这些非法架设的物品。 遗留物侦测还可以用于侦测遗规泊车的情形,结合车牌辨识系统更可达到全自动的智能化执法。一旦发现禁止停车区域有车辆停留,便会触发遗留物警报讯号,并启动车牌辨识器记录违规停泊车辆的车牌号码,大大降低交通执法人员的工作量和运作成本。

2.6.4 遗失物检测

在博物馆或公共展览厅贵重物品失窃的情形时有发生,单纯依靠录像做事后处理的消极性做法往往不能解决问题,如果在物品遭窃的瞬间就能马上发现对于防范事件有相当重要的作用。遗失物侦测的作用是可以侦测到画面上物品被移走或是偷走的情形,及时发出警报,同时也能自动分辨出对象属于遗留物还是遗失物。但这类检测对同色物体的分辨分析运算能力有很高的要求,同时对硬件的配套布置也有很严格的要求。

当摄影机被移动或是画面被遮蔽时会造成场景变化,侦测器便可以根据这种情况判断摄影机异常并发出警报。这种应用更加广泛。通产的移动检测都属于此范畴。

在实际应用场景中,日光对监控的影响较大,一般要避免逆光。

3 结束语

综上所述,目标跟踪有非常广泛的应用市场需求,我国还处于起步阶段,研发出具有自主知识产权的、稳定可靠、技术先进、节约成本等特点的智能监控系统,可以有效填补国内空白。随着技术的成熟,硬件的推陈出新,应用产品的大幅降价,使得应用范围不断扩大,将来这方面会有更好的前景,使之成为一个能带动相关产业集体发展的一个新型产业。

3.1 对经济发展的作用

良好的市场前景会促进企业在该产业的科技力量投入,有力促进了智能监控技术革新,使得企业进入了经济发展的快车道,同时带动了电子产业及相关企业的技术革新及经济发展。形成技术革新与资金的一个良性循环。

3.2 对社会发展的作用

增加了对地方经济和就业需求的拉动。产业链的形成,强化实施企业之间的横向经济联合和技术协作,通过企业间技术平台上的横向协作,在特色产业基地内形成合力,打造一条新型的产业链。

3.3 对人才培养推动作用

企业的相关类技术人员之间不断的合作交流,大大提高了企业相关类技术人才一个质的飞跃。达到技术推介和人才培养的目的,为国内,特别是经济发达地区今后在电子科研技术领域的进一步发展奠定人才技术的基础。

参考文献:

计算机视觉的研究内容篇6

关键词计算机图形学第三方演示课程群分组实践

abstractatpresent,computergraphicshasbecomeanimportantpartofundergraduatecomputereducation,anditisalsoplaysanimportantroletocultivateinnovativetalentstoadapttotheinformationage.Basedontheteachingofcomputergraphicscoursebytheauthorasanexample,analyzestheexistingproblemsintheteachingofcomputergraphics,andputforwardimprovementideasfromthreeaspects:accordingtothedifferentneedsofstudentsutilizingthethirdpartydemonstrationteachingandcrosscurriculuminterpretation,introducingcoursegrouptoreplacesinglecourse,employinggrouppracticeexaminationinsteadofindividual,andotherformstoimprovethequalityofteaching.

Keywordscomputergraphics;thirdpartydemonstration;coursegroup;grouppractic

计算机图形学是一门介绍显示、生成和处理计算机图形的原理和方法的课程。它在计算机总体教学体系中属内容综合性较强且发展迅速的方向之一。该课程既有具体的图形软硬件实现,又有抽象的理论和算法,旨在为学生从事相关工作打下坚实基础。学生须以高等数学和线性代数的基本理论和较熟练的程序设计能力作为本课程学习的基础。课程的难点在于计算机图形学研究范围广,与其他学科交叉性强,且知识不断更新变化。在教学实施过程中,难点是理解和掌握相应的基础理论和算法,以及利用计算机图形学相关工具进行图形学实际问题的解决。

本课程对学生的培养学生围绕以下三个方面展开:(1)建立对计算机图形学的基本认识,理解图形的表示与数据结构、曲线曲面的基本概念。(2)理解并掌握基本图形的生成算法,并能对现有的算法进行改进,理解图形的变换和裁减算法。(3)面向算机图形的程序设计能力,以底层图形生成算法为核心构建应用程序。相应的考查方式由理论授课、上机实习和课外作业三个单元构成。从近年的授课实践和考试情况分析,该教学内容难度设置合理,深入浅出且相互承接成为体系,学生总体反馈良好。但也存在一些矛盾和问题。以下将对几个问题进行重点阐述与思考,并提出课程改革思路。

1计算机图形学与计算机辅助设计衔接问题

笔者所在院校是具有航空航天背景的工科院校,“CaD计算机辅助设计”是飞行器设计、机械设计与制造等多学科的重要课程。相关学科学生期望通过对计算机图形学知识的深入理解,促进CaD设计工具诸如Catia、Solidwork和Rhino等先进工具的运用能力。然而,目前的计算机图形学课程的教学和考察环节倚重低层算法讲解与基于openGL等的程序设计,除综述外并未具体引入CaD相关内容。产生的问题是,一方面,飞行器设计及机械设计与制造等专业的学生由于程序设计能力不足,难以驾驭较复杂的程序设计任务,在学习过程中心理压力较大;另一方面,由于授课均为教师为计算机相关专业背景,该课程的讲授并未衔接CaD相关技术,学生难以构建二者之间的联系。

解决方案:

本质上,该问题是由于选课学生的学习动机和基础不同造成的。以单一的教学和考查方式难以兼顾这类面向具体应用的学习需求。在教学方法上,采用第三方案例教学法和交叉讲解法相结合以解决此问题。具体的,将CaD等应用场合以具体案例形式讲解,授课教师邀请飞行器、机械设计相关教研组研究生以4~6学时的讲台演示的形式呈现CaD工具完整设计过程。授课教师则以交叉讲解方式为学生讲解运用到的计算机图形学知识点,同时与学生交互式的问答和探讨。在考查形式上,考虑到不同的学习动机和基础,采用多样化实践环节考查。计算机专业学生以openGL程序设计为考点,而外专业学生以CaD等面向应用的实践工具为考点,以兼顾各专业的学习需求。

2计算机图形学与计算机视觉相结合的问题

当前,虚拟现实技术(VR)和人工智能技术(ai)两个最重要最热门的研究领域。虚拟现实的基础理论支撑是计算机图形学,例如三维场景的生成与显示。而人工智能的一个重要应用场景是计算机视觉,例如基于图像智能识别的自动驾驶技术和场景理解技术。很多学生对以计算机视觉为代表的人工智能技术怀有浓厚兴趣,同时,学生又难以区分计算机图形学和计算机视觉的关系。同时,二者在近年来的研究中呈现相互融合的趋势。如基于三维立体视觉的机器人与场景实时定位与重建。如何在计算机图形学课程中,很好地体现两门课程的不同,避免学生的混淆,拓展学生的知识面,都是具有现实意义的课题。

解决方案:

实际上,计算机图形学和计算机视觉可不失一般性的概括为互逆的关系:计算机图形学是由概念设计到模型生成,最终绘制图形图像的过程;而计算机视觉则是从原始图像中再加工并分析理解、以产生新图像(如二维到三维)或输出语义信息(如图像自动标注与理解、目标检测与识别)。将计算机图形学纳入“视觉处理课程群”框架,使学生首先掌握课程群中各课程的侧重点,着重理解图形学在课程群中的作用。精心选取2~3个计算机视觉和图形学交叉的当前主流研究方向,展开概念层面的演示讲解,不深究具体算法,着重阐述两种技术的相互依赖关系并对比二者的区别。相关领域的演示还包括增强现实、人机交互、计算机辅助诊断等等。鼓励学生自主学习,最终使学生在做中学、用中学,提高独立分析新问题和综合运用知识解决问题的能力。

3如何平衡算法讲解和程序应用技能

计算机图形学涉及的算法多,核心算法是该课程的必讲内容,在算法细节的讲解过程中学生容易产生畏难厌学情绪,注意教学方法以调动学生的兴趣尤为重要。另一方面,对学生的考察方式最终是通过编程实践完成。学生在编程实践中常常遇到大量调试问题,同时要阅读大量文档以了解openGL接口函数的调用方法,这个过程占用了很大工作量。

解决方案:

在理论教学部分,着重讲清计算机图形学原理和概念、全面解析经典算法思想。课程强调对理论核心思想的阐述,用通俗易懂的语言,条例清晰的逻辑,进行简明透彻的阐述,附以直观、形象的动态演示系统,力图使学生在较短的时间内、有效地掌握基本理论。分析图形学各种经典算法的原理、可行性及几何复杂性,尽可能多地比较算法之间的思想差异,分别指出它们的优缺点和应用场合,并促进学生思考如何在保证算法的准确性、可靠性的前提下,提高算法的效率。同时注重接近国际前沿的研究内容,注重讲授经典知识和最新进展相结合,以激发学生的学习兴趣,提高课堂效率和活跃度,力争以较少的课时阐述计算机图形学的基本原理、基本方法,加大实践环节比重。通过往年学生完成的优秀课程作业作品的展示,激发学生的创造热情。改革实践环节的考查方式,以项目小组形式取代对个体的考查。原则上每组3~5人,自由组合。在课程结束前,采用小组现场演示讲解的方式,展示小组成员通过编程实践环节完成的一个项目。学生在项目小m中锻炼了团队协作能力,降低了个人工作强度,同时互相学习和督促的氛围使课程作业的质量得以大幅提高。以基础实验――目标性重建实验――自主性训练的层次化实践框架模式,逐步培养学生自主研究,独立解决问题、分析问题,确定解决方案的能力,树立正确的科学研究习惯,培养学生的科学研究能力。

总之,合理设计实践教学案例,进一步实现课程体系和实践内容的统一,建立一个多层次、立体化的实践教学体系,注重学生的参与性与实践性,引导和鼓励学生进行创新实践和课外研学。改革考核方式和考试形式,加大实践环节在成绩中的比重,强化实践能力培养,寓教于乐的同时引导学生追求卓越。此外,计算机图形学技术是发展非常快的一个研究及应用领域,且对编程要求较高,应注重实验室机房投入更新必要硬件,并保障软件编程环境的正常运行。

L鼙疚氖苤泄┦亢蠡YBa15035,江苏省教改项目JGLX13_008资助

参考文献

[1]孙家广,胡事民.计算机图形学基础教程.北京:清华大学出版社,2005.2.

[2]唐荣锡,汪嘉业,彭群生等.计算机图形学教程(修订版).北京:科学出版社,2000.

[3]LiUHailan.ondevelopmentandapplicationofcomputergraphics[J].ComputerKnowledgeandtechnology,2010(3):9551-9552.

[4]娄凤伟.创造性思维与计算机基础教学[J].教育探索,2002.

计算机视觉的研究内容篇7

关键词:计算机立体视觉;双目立体成像;视差

中图分类号:tp37文献标识码:a文章编号:1009-3044(2011)12-2929-03

BinocularStereoimagingBasedontheComputerDisparitymappingforStereoscopic3D

YanGFu-bao

(HefeiUniversityoftechnology,Hefei230009,China)

abstract:Binocularstereoimagingwhichbasedonthecomputerdisparitymappingforstereoscopic3D,dealswithmanychallengingproblemsincomputervision,patternrecognitionandcomputergraphics.themainproblemsarethatthestereovisionsarenotvividandnaturalenough,peopledon'thaveathoroughknowledgeofthefunctionsoftheireyesandthebinocularstereovisionsandtherearestillsomeproblemstosolveinthegettingofstereoimages.thisarticleproposesanewmethodtocreatestereoimagesbasedonacertain3Dmodelthatalreadybeenbuilt,introducesamethodtocreatbinocularstereovisionsbycameras,studysseveralimportantfactorsthataffectstereoeffects,includingtherelationshipbetweenthetargetcameraandthe3Dmodels,camwideandthecontrolofthepositionofthescreen,etc.thesestudysarebasedonthedeepstudyofthebinocularstereovisionofcomputerdisparitymappingforstereoscopic3Dandprovidetheoryandtechnicalsupportfortheapplicationofbinocularstereoimaginginvisualstereodisplays.

Keywords:computerstereovision;binocularstereoimaging;parallax

随着《阿凡达》的热映,立体3D现在已经成为大众消费的一个主流产品。电影院线越来越多的电影都加入到3D立体的行列,电视频道也开始尝试推出三维广播节目,越来越多的公司开始提供3DtV和蓝光3D的播放设备。尽管这些技术的进步在不断的进步,但是在立体内容的实际生产中,如何让观众在一个自然、舒适的环境中观看立体视频仍然是一个很大的挑战。

最根本的问题在于,在人类复杂的视觉感知和显示设备限制的相互作用。因此,视觉内容必须适应特定应用的特殊性场景。对于立体3D视频领域,在计算机图形学对此内容重定向或映射的问题进行了广泛的研究。虽然今天的3D显示技术可以重构双目立体视觉,但是受深度信息的影响,不能在一个平面上真实地再现图像的深度。当屏幕上显示一个遥远的对象时,这种冲突会造成严重后果,强烈的负视差可能会导致不舒服的观看的经验,可以引起暂时性复视,无法融合立体图像。

1国内外3D视频产业发展现状

1.1国外3D产业现状

随着《阿凡达》的大热,消费者对3D的狂热在国际上掀起一轮3D热潮。美国、日本、欧洲纷纷加大3D产业的投入力度,加紧研发3D立体视频产品,并积极参与相关国际3D标准的制定。一些国家已经开播3D频道。英国天空电视台正式启播SKY3D电视频道和美国eSpn3D频道直播南非世界杯足球赛之后,日本天空完美卫星通信公司联手索尼公司将在其卫星高清电视中推出一个专门的世界杯3D频道,为日本电视家庭提供南非世界杯足球赛3DtV直播。

美国作为全球3D产业的领跑者对于3D产业自然不遗余力,但之前的重点一直集中在3D动画上。而与之前不同的是,此次的3D热潮,带动起从内容商到传输商到设备商这一整条产业链的热情。

1.2国内3D产业现状

与国外的3D产业发展相比,我国的3D产业起步相对较晚,3D内容不多,在技术方案及产业链方面还不成熟,但是目前国内的3D产业也已步人快速成长期。在索尼、松下等国外企业纷纷推出相关产品的同时,国内各家电企业相继推出了3D立体现实产品,并已上市销售。

国内相关企业和科研院所在3D内容制作、3D编解码技术、3D传输与存储、3D显示终端等方面已经拥有一定产业基础。很多高校都已开展3D立体显示方面的研究。据了解,在我国进行3D技术研究和产品研发的企业也越来越多。

2双目立体成像研究

在现实生活中,人们通过眼睛观察的周围环境之所以是立体的,是因为人的两只眼睛所处的空间位置不同,可以从两个不同的视角同时获得两幅不同的场景图像,如图1所示,左眼仅能够看到aB面,右眼仅看到aC面,经人脑判断后就能感知到完整的物体aBC的形状和距离。人的大脑对这两幅图像进行处理后,根据两幅图像的差异判断出物体与双眼的距离等空间信息,形成一幅立体的画面就呈现在脑海中。

理论和实验表明,两个目标摄像机与三维模型的位置关系、两个目标摄像机之间的距离、会聚角变化值等,是影响立体效果的重要因素,下面就定性地讨论这些因素。

计算机视觉的研究内容篇8

第3期谢珺,等:机器视觉在轮胎检测领域的应用研究

(1)算法的精确性提高伴随着计算量的成倍增加,处理时间就成为了实时检测的软肋;(2)硬件的分辨率提高了,图像的分辨率、精度也随之提高了,但是数据量计算量都因此成倍增加。因此,如何保证检测的实时性和准确性,是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术

2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CmoS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论,其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论,以及RichardHartley的《multipleViewGeometryinComputerVision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法,主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既优化了图像的视觉效果,又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域,是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点,经过分析处理以后,转换成坐标数据,然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域,机器视觉技术的应用还仅仅停留在理论之上,还没有可实际应用的商品化的设备,更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。

2.2嵌入式技术嵌入式系统一般指非pC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的,适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备,如掌上pDa、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点应用的,它通常都具有低功耗、体积小,集成度高等特点;(2)嵌入式系统和具体应用有机地结合在一起,它的升级换代也是和具体产品同步进行的,因此嵌入式系统产品一旦进入市场,就具有较长的生命周期;(3)由于空间和各种资源相对不足,嵌入式系统的硬件和软件都必须设计,量体裁衣、去除冗余,力争在同样的硅片面积上实现更高的性能,这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSp(数字信号处理器)来进行开发,具体型号为ti公司的tmS320。它具有很高的编译效率和执行速度,在信号处理方面具有优势,它的特点如下:(1)程序和数据具有独立的存储空间,有着各自独立的程序总线与数据总线,可以同时对数据和程序进行寻址,大大提高了数据处理能力;(2)由于广泛采用了流水线操作,减少了指令的执行时间,可以同时运行8条指令;(3)与一般计算机不同,乘法(除法)不由加法和移位实现,它具有硬件乘法器,乘法运算可以在一个指令周期内完成;(4)指令周期降到了1.67ns。随着工作频率进一步提高,指令周期将进一步缩短;(5)拥有自己独特的专门为数字信号处理而设计的指令系统;(6)相比传统的处理芯片,它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成

3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题:(1)数据处理量非常庞大;(2)如何快读匹配图像;(3)如何快速实现缺陷分割并剔除伪缺陷;(4)如何选取缺陷特征,用以实现缺陷识别。以具体产品为例,相对其他轮胎产品,航空轮胎对质量检测的要求较为严格,只要航空轮胎的检测技术到位,其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例,根据GB/t9747-2008《航空轮胎试验方法》、GB/t13652-2004《航空轮胎表面质量》和GB15323-1994《航空轮胎内胎》等标准的要求,研究表面缺陷在线检测的图像处理方案;开发一套基于机器视觉的产品表面缺陷的在线检测设备,同时根据GB/t13653-2004《航空轮胎X射线检测方法》所述,配合X射线发射仪,利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷,如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标:(1)能检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率要求大于90%;(2)对缺陷部位进行定量和定位分析:读出缺陷的尺寸(误差0.5mm),测出缺陷距离轮胎表面的深度,决定缺陷在轮胎内部的位置;(3)在线检测设备的检测检测速度与X射线管旋转速度同步,X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。

3.2研究内容和技术路线

3.2.1确定机器视觉检测系统的基本框架在数据量大时,采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中,由于航空轮胎的圆周面比较大,数据量也就比较大,通常采用的机器视觉单摄像机方式,很难满足圆周面检测分辨率高、数据量大的要求,而多台摄像机能满足分辨率和数据量的要求,却又相应带来实时性差的问题。若采用多台摄像机的方式,就需要配备多套成像系统,一套成像系统造价在10万元左右,基于成本和计算数据量的考虑,本研究选用一对一方式,利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说,就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测,该结构主要由四部分组成:服务器(嵌入式系统)、客户端(图像处理子系统)、信号模块(pLC)、输出单元。系统框架如图1所示。每隔一定的时间(系统初步设定为5s),服务器通过pLC控制步进电机驱动轮胎做圆周转动,每转过一个固定角度(系统定为120°),服务器就调动客户端完成此区域内相对独立的视觉检测任务,一次间隔只检测轮胎的三分之一(120/360),经过3个时间间隔,客户端即完成了整个轮胎360°的全面检测,然后利用拼接原理把各部分拼接起来,统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同,然后消除不同,统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互,本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口,服务器不仅要完成检测任务的调度,还要可以设定检测参数,接收和实时显示客户端上传的图像数据和处理结果(缺陷等),并将信息存入数据库中。此外,服务器还接收pLC传来的位置检测信号,用于与客户端的同步,并且根据检测结果中的位置信号,对执行机构发出动作信号,标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡,接收服务器设置的参数和任务调度,控制采集卡和摄像机完成图像实时采集,利用图像处理算法处理和分析图像数据,将最终得到的缺陷位置和分类信息上传给服务器,保存缺陷图像以备查。

3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中,根据图像数据的特点,本研究提出以下图像处理过程:缺陷分割、特征提取及缺陷分类。首先是缺陷分割:在表面缺陷检测的时候,利用图像处理算法,处理采集到的产品表面图像,将缺陷从复杂的背景图像中分离出来。接着是特征提取:提取缺陷后,对缺陷的各种标识性属性进行提取,主要是几何特征和灰度统计特征,以保证后续的缺陷分类和识别。几何特征指的是轮廓特征,比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类:本研究采用改进的Bp算法[7]对网络进行训练,构建神经网络分类器来实现轮胎缺陷分类,为了提高检测系统对伪缺陷的适应性,本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法,为避免编程中出现内存泄露进而造成计算机内存资源流失的现象,决定采用对内存进行托管的C#语言进行编程。

3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点,它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题,包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性,采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。

4结论实际测量结果证明,应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势,设备简单、易用,克服了传统测量仪器的许多误差来源,具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分(如图3所示),与传统的测量方法相比,原先需要15min的测量时间,现在只需要15~30s就可完成,操作也更加简单便捷。该系统可检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率为96%。

参考文献:

[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉:华中科技大学,2008.

[2]ZHanGZ.Determiningtheepipolargeometryanditsuncertainty[J].aReviewintJournalonComputerVision,1998,27(2):161-195.

[3]章毓晋.图像处理和分析[m].北京:清华大学出版社,1999.

计算机视觉的研究内容篇9

盲人,女性,博士,计算机专家,这就是对浅川智惠子最为贴切的描述。而这几者的叠加,本身就充满了传奇色彩。

在近日举行的“对话智者,iBm大师走进校园”的启动仪式上,浅川智惠子博士向记者透露了她的非凡成长经历。

可以说,生活对于浅川智惠子曾经两次归零。14岁之前,“痛恨学习”的她,是个有前途的运动员,曾经梦想进入奥运比赛。一次意外事故使她失明,人生道路也因此而改变。“虽然我是一个盲人,可我还是可以做些与众不同的事情。”她以这样积极乐观的人生态度重新开始。

然而,就在1983年,她获得ottemonn大学英国文学学士学位,踌躇满志地准备开始职业生涯的时候,命运再次将她推入谷底:毕业后的她很难在日本找到工作,文学甚至不能让她养活自己……

这一打击让浅川智惠子几乎丧失了挑战精神,但命运的另一扇大门此时也向她敞开。1985年,浅川智惠子在经历了盲人职业学校的计算机培训和iBm东京研究实验室的实习后,正式加入iBm公司,从此“弃文学武”的她再也离不开计算机事业。这被她称为职业生涯中的误打误撞,却让她迎来了全新的生活,甚至可以说让她在黑暗中迎来了光明。

“除了专门为盲人设计的工作之外,当时要找到其他工作非常困难。所以我为自己能找到iBm而感到幸运。”要知道,直到1981年,iBm才在美国首次推出个人计算机。但由于一直关注残障人士的需求,时隔3年,iBm就发明了能够发音的终端。正是有这样的机遇,浅川智惠子才能进入iBm工作,并成为iBm第一个使用这种特殊计算机的人。

她参与的第一个项目就是让计算机自动地把数字数据翻译成盲文。从此,浅川智惠子进入了无障碍研发领域,职业生涯也屡攀高峰。

无障碍研究到底是一项什么样的工作呢?在20年前,除了盲文和盲文打字机以外,盲人几乎没有任何辅助工作的工具。而盲文书籍比一般书籍要厚20倍到30倍,当时制作盲文书籍是非常艰巨的一件工作。

1987年,iBm日本公司开始在日本全国范围内推广盲文网络,浅川智惠子参与了这个项目并负责盲文编辑系统。该系统本质上就是盲文的文字处理系统,盲人可以通过系统直接向工作站输入文本。而iBm特殊机器的显示器可以显示出盲文的凸点,庞大书籍的内容也可以在很小的显示器上全部显示出来。

同时,通过这个系统,全国各地的图书馆就可以联在一起,各种读者都能够及时地得到最新的畅销书内容,盲人也因此受益。浅川智惠子开发了这种数字盲文系统及其三个主要应用。其中,盲文编辑系统能够使用户轻松通过鼠标和显示器来输入并编辑盲文,盲文词典系统及iBm盲文论坛已成为日本盲文书籍的标准系统。

1997年,随着互联网的兴起,浅川智惠子的创新任务也随即而至。那时,经常有人谈到互联网的使用体验,而她也意识到对视觉有障碍的人来说,有必要像视觉正常的人一样充分利用互联网,享受新技术带来的便利。怎样让盲人也能使用互联网?一种能够发声的网络浏览器系统――主页阅读器因此诞生。由于盲人可以首次利用其使用互联网,这项发明在社会上引起轰动。目前,iBm主页浏览器以11种语言在世界范围内发行,通过它,人们可以用数字键盘上网,还可以把互联网及其他网络资源由文字、图像转换成语音。

计算机视觉的研究内容篇10

[论文关键词]数字教学虚拟现实技术交互式教学模式

随着国家发展“大学科”及交叉学科的教育建设思想的推进,现代教育要求不仅掌握知识、学习能力和方法,更要进行必要的人文主义教育,交互式教学法实现了教师与学生以及学生之间的交互。虚拟现实技术的发展和应用,使人机交互更好地与日常生活经验相契合,为交互式的教学方法提供了技术支持。本研究旨在通过研究人的行为,运用交互式的教学方法,探究以虚拟现实技术为代表的先进技术在未来数字教学模式中的应用。

一、基于虚拟现实的交互式数字教学方法研究与分析

1.人机交互。人机交互过程是指人通过人机界面向计算机输入指令,计算机处理后把输出结果呈现给用户的过程。人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史,它经历了几个阶段。

人机交互的方式可以分为数据交互、图像交互、语音交互和行为交互四类,其中行为交互是当今社会研究的重点,它是指通过身体的姿态和动作来表达意思。行为交互是计算机通过定位和识别人类,跟踪人类肢体运动和表情特征,从而理解人类的动作和行为,并作出相应的智能反馈过程,它将带来全新的、最自然的交互方式。计算机通过用户行为能够预测用户想要做什么,并以此来满足用户的需求。比如,计算机通过跟踪人们的视线,就能预测用户的意图,是想要浏览什么网站还是需要打电话等,它有助于形成更适合未来数字教育的交互方式。现代教学,教的内容趋于多样化,学生的需求也趋于多样化、多层次,每个学生的个体差异也更为突出,怎么针对这些新的特征,利用更好的交互技术,使教与学的内容在数字化的平台上,更好地照顾学生的个性化特征和需要,更好地实现教师个体与学生个体之间以及学生群体之间的相互交流、互动学习就变得尤为重要。

前面提到,人机交互需要由相应的人机界面来使之形象化。人机界面是人与计算机之间传递、交换信息的媒介和对话接口,凡参与人机信息交流的领域都存在着人机界面,它是人机双向信息交互的支持软件和硬件,也是进行交互设计最终展现给用户的结果,所以,对人机界面的充分了解对分析数字教学中的交互设计不可或缺。

2.虚拟现实技术。要实现上面所述的自然交互过程,需要运用高科技手段,比如近几年逐渐成熟的虚拟现实技术,利用电脑模拟产生一个三度空间的虚拟世界,集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术的最新发展成果,提供使用者视觉、听觉、触觉等感官的模拟,让使用者如同身临其境一般,及时、无限制地观察三度空间内的事物。在教学中,它运用于实验模拟、场景再现,可以把枯燥繁琐的文字知识形象地进行转化,帮助学生主动地思考、学习,是既有意思又是符合未来教育模式的一种技术。

虚拟现实具有三“i”的基本特征,即immersion-interaction-imagination(沉浸—交互—构想),强调虚拟系统中人的主导作用。沉浸感指用户沉浸于计算机生成的虚拟环境中,有身临其境之感。交互性指用户与虚拟场景中各种对象相互作用的能力,是人机和谐的关键性因素。想象力则是用户从定性和定量综合集成的环境中得到感性和理性的认识,从而可以深化概念,萌发新颖的认识。

按照用户参与的形式以及沉浸程度,虚拟现实可以分为桌面虚拟现实、沉浸式虚拟现实、增强现实性的虚拟现实和分布式虚拟现实系统四类。虚拟现实系统强调的是人与虚拟环境之间的交互作用,或是两者相互作用,从而反映出虚拟环境所提供的各种感官刺激信号以及人对虚拟环境做出的各种反应动作。虚拟环境给人提供的各种感官刺激包括视觉、听觉、嗅觉、味觉、触觉、力觉、身体感觉及前庭感觉,在物理、化学及设计类课程的互动教学中应用前景广阔,虚拟环境能够逼真模拟物理中的力觉与触觉,生物化学中的嗅觉和味觉,而各种设计类课程中的大量视觉图像图形的动态信息也能够更好地呈现出来,在教学中起到很好的演示作用。另外,虚拟现实的技术能够较好地调动学生的学习积极性,使枯燥的内容更形象化呈现出来,同时教师也可以应用虚拟现实的仿真模拟技术,将逻辑思维较强的教学内容,通过仿真模拟的方式,预测到由于公式及参数的改变而可能产生的预期结果,并科学地呈现出视觉、听觉、触觉、力觉等多种感知的结果,加深学生的感性认知,“上手(Hands-on)”和“交互式”的教学能够引发更多的积极的注意力,帮助学生更透彻地理解抽象的原理。

3.现代教育与数字教学。数字教学是指教师和学习者在数字化的教学环境中,遵循现代教育理论和规律,运用数字化的教学资源,以数字教学模式培养适应新世纪需要的具有创新意识和创新能力的复合型人才的教学活动。随着计算机和互联网技术的日益发展及应用,数字教学模式主要应用于多媒体教学和网络教学领域,并逐渐深入到学习的方方面面。

但现阶段的数字教学仍然存在缺陷。首先,计算机无法对学生的情绪变化作出相应反馈,而且它也无法取代教师在教学过程中一些暗示性的语言所起到的微妙效果。其次,在教学的许多领域中,计算机无能为力,特别是非逻辑判断方面。最后,教学课件在实际使用中存在着局限性。这一系列的问题,相信通过运用交互设计的方法,结合虚拟现实技术的应用,都会被逐一解决。

[论文摘要]以虚拟现实技术为发展趋势的信息技术日新月异,当它被应用到教育领域时,能够提供逼真的实验环境和事件场景,内容组织安排特别强调学生主动参与来构建知识结构,使学生由“被动听讲”转变为“主动学习”,教与学之间能产生更好更强的互动,是信息时代教学模式的主要发展趋势。文章旨在分析探索以虚拟现实技术为基础、以交互式为导向的数字教学模式,并从教学资源、师资队伍、个性化教学及整合网络教育平台四个方面详细阐释了基于虚拟现实技术的交互式数字教学模式的构建。

[论文关键词]数字教学虚拟现实技术交互式教学模式

随着国家发展“大学科”及交叉学科的教育建设思想的推进,现代教育要求不仅掌握知识、学习能力和方法,更要进行必要的人文主义教育,交互式教学法实现了教师与学生以及学生之间的交互。虚拟现实技术的发展和应用,使人机交互更好地与日常生活经验相契合,为交互式的教学方法提供了技术支持。本研究旨在通过研究人的行为,运用交互式的教学方法,探究以虚拟现实技术为代表的先进技术在未来数字教学模式中的应用。

一、基于虚拟现实的交互式数字教学方法研究与分析

1.人机交互。人机交互过程是指人通过人机界面向计算机输入指令,计算机处理后把输出结果呈现给用户的过程。人机交互的发展历史,是从人适应计算机到计算机不断地适应人的发展史,它经历了几个阶段。

人机交互的方式可以分为数据交互、图像交互、语音交互和行为交互四类,其中行为交互是当今社会研究的重点,它是指通过身体的姿态和动作来表达意思。行为交互是计算机通过定位和识别人类,跟踪人类肢体运动和表情特征,从而理解人类的动作和行为,并作出相应的智能反馈过程,它将带来全新的、最自然的交互方式。计算机通过用户行为能够预测用户想要做什么,并以此来满足用户的需求。比如,计算机通过跟踪人们的视线,就能预测用户的意图,是想要浏览什么网站还是需要打电话等,它有助于形成更适合未来数字教育的交互方式。现代教学,教的内容趋于多样化,学生的需求也趋于多样化、多层次,每个学生的个体差异也更为突出,怎么针对这些新的特征,利用更好的交互技术,使教与学的内容在数字化的平台上,更好地照顾学生的个性化特征和需要,更好地实现教师个体与学生个体之间以及学生群体之间的相互交流、互动学习就变得尤为重要。

前面提到,人机交互需要由相应的人机界面来使之形象化。人机界面是人与计算机之间传递、交换信息的媒介和对话接口,凡参与人机信息交流的领域都存在着人机界面,它是人机双向信息交互的支持软件和硬件,也是进行交互设计最终展现给用户的结果,所以,对人机界面的充分了解对分析数字教学中的交互设计不可或缺。

2.虚拟现实技术。要实现上面所述的自然交互过程,需要运用高科技手段,比如近几年逐渐成熟的虚拟现实技术,利用电脑模拟产生一个三度空间的虚拟世界,集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术的最新发展成果,提供使用者视觉、听觉、触觉等感官的模拟,让使用者如同身临其境一般,及时、无限制地观察三度空间内的事物。在教学中,它运用于实验模拟、场景再现,可以把枯燥繁琐的文字知识形象地进行转化,帮助学生主动地思考、学习,是既有意思又是符合未来教育模式的一种技术。

虚拟现实具有三“i”的基本特征,即immersion-interaction-imagination(沉浸—交互—构想),强调虚拟系统中人的主导作用。沉浸感指用户沉浸于计算机生成的虚拟环境中,有身临其境之感。交互性指用户与虚拟场景中各种对象相互作用的能力,是人机和谐的关键性因素。想象力则是用户从定性和定量综合集成的环境中得到感性和理性的认识,从而可以深化概念,萌发新颖的认识。

按照用户参与的形式以及沉浸程度,虚拟现实可以分为桌面虚拟现实、沉浸式虚拟现实、增强现实性的虚拟现实和分布式虚拟现实系统四类。虚拟现实系统强调的是人与虚拟环境之间的交互作用,或是两者相互作用,从而反映出虚拟环境所提供的各种感官刺激信号以及人对虚拟环境做出的各种反应动作。虚拟环境给人提供的各种感官刺激包括视觉、听觉、嗅觉、味觉、触觉、力觉、身体感觉及前庭感觉,在物理、化学及设计类课程的互动教学中应用前景广阔,虚拟环境能够逼真模拟物理中的力觉与触觉,生物化学中的嗅觉和味觉,而各种设计类课程中的大量视觉图像图形的动态信息也能够更好地呈现出来,在教学中起到很好的演示作用。另外,虚拟现实的技术能够较好地调动学生的学习积极性,使枯燥的内容更形象化呈现出来,同时教师也可以应用虚拟现实的仿真模拟技术,将逻辑思维较强的教学内容,通过仿真模拟的方式,预测到由于公式及参数的改变而可能产生的预期结果,并科学地呈现出视觉、听觉、触觉、力觉等多种感知的结果,加深学生的感性认知,“上手(Hands-on)”和“交互式”的教学能够引发更多的积极的注意力,帮助学生更透彻地理解抽象的原理。

3.现代教育与数字教学。数字教学是指教师和学习者在数字化的教学环境中,遵循现代教育理论和规律,运用数字化的教学资源,以数字教学模式培养适应新世纪需要的具有创新意识和创新能力的复合型人才的教学活动。随着计算机和互联网技术的日益发展及应用,数字教学模式主要应用于多媒体教学和网络教学领域,并逐渐深入到学习的方方面面。

但现阶段的数字教学仍然存在缺陷。首先,计算机无法对学生的情绪变化作出相应反馈,而且它也无法取代教师在教学过程中一些暗示性的语言所起到的微妙效果。其次,在教学的许多领域中,计算机无能为力,特别是非逻辑判断方面。最后,教学课件在实际使用中存在着局限性。这一系列的问题,相信通过运用交互设计的方法,结合虚拟现实技术的应用,都会被逐一解决。

二、交互式数字教学模式构建

基于虚拟现实技术的交互式数字教学模式,能够通过虚拟现实技术,以文本、图片、影像、声音、数据采集及感应技术、影像及数字感知内容为主要交互媒体,以自然式的交互方式,配合可互动操作的动态信息、仿真模拟、各种感觉与知觉的数字反馈技术,多维度、多媒体、多人互动式地展示im及时通讯、留言板、互联网上的博客、tag、SnS、RSS、wiki等多种形式的数字内容,以教学的核心内容为课程组织的基础,构建适应当下以数字信息为主要教学内容的互动式教学模式。基于虚拟现实技术的交互式教学模式的构建主要从以下几个方面入手:

1.提供多维度的丰富教学资源。有效传播多种媒体的多样化信息,提高学生对于教学内容的注意力。虚拟现实的技术能够为交互式数字教学模式设计立体的教学模式效果,将课堂理论教学、实验室教学、企业基地等实地教学相结合,理论专题研讨、案例教学、技术实践小组协作等多种教学方法交叉,利用虚拟现实技术呈现理论公式,如化学课中的元素周期表,可以将分子、原子等抽象的结构可视化表现出来,还可将复杂的实验通过虚拟现实技术模拟出来,如用虚拟现实模拟火山喷发,模拟火箭的发射过程,模拟汽车内引擎的工作原理,模拟复杂机构之间的关系和相互作用,智能地调配物流情况,模拟资金流及相关的经济问题等,还可运用CaVe计算机辅助虚拟现实环境技术,模拟汽车的设计、装配等实践教学环境,运用虚拟现实技术搭建在企业基地等实地教学的内容,实现教学的开放性、时效性、针对性和实战性,提供多维度的丰富的教学资源。

2.构建多学科交叉的综合型师资队伍。随着信息社会的迅猛发展,围绕信息社会的人文、技术、经济等各种交叉学科领域,发展数字内容的交互式教学模式需要培训一支具有综合学科背景的师资力量。而虚拟现实等先进的信息技术,能够整合各学校的优秀师资力量,通过构建虚拟、虚拟名师等方式,将各高校、研究机构及企业社会的优秀师资集合起来,通过虚拟人的名师角色,远程指导或虚拟地呈现其学术内容与教学思想,有效地弥补师资力量不足的问题,随时更新名师提供的动态电子教材,提供多学科交叉的综合型教学内容与综合型师资队伍。

3.实现交互式因材施教的个性化教学。参与式教学的交互教学模式能够充分调动学生的积极性,构建虚拟现实的实验学习环境,根据每个学生的个性特点及专长,搭建适合学生的个性化教学实验环节,模拟搭建实验环境,让学生充分展开想象,模拟仿真其实验效果,预演实验结果,有助于提高学生对于课程内容的参与度和认知程度。另外,学生还可根据自身的兴趣点,专项选择适合自己发展特点的学习内容,个性化地定制学习内容。教师可根据每个学生的学习情况,跟踪分析其学习结果,对症安排辅导及进一步深入学习的内容,提高学习效率,增强交互式学习的效力。麻省理工学院媒体实验室在1993年推出了实体交互设计的数字教学产品,它整合了个人空间和共享学习工作空间,能让两位用户在个人空间和共享空间之间实现轻松的转换。这种交互式的教学产品是一种电子白板,产品使用生活中自然的互动交流方式,如教学过程中交流双方各自的头部动作,双方眼神的交流和凝视方向等,这些交流的姿势能够被3D摄像头等装置识别出来,并通过计算机进行智能判断,根据计算机图形、图像识别技术,判断教学双方用户姿势的变化,同时和姿势所代表的含义进行映射匹配。这种交互式的教学电子白板的隐喻是“让用户自由地交流,使用电子白板进行交流的时候就像在巨大的透明玻璃板上画画一样自然”。经实践证明,这种交互式的电子白板增强了教学双方用户的“凝视注意力”,能够使用户看到使用电子白板的同伴的凝视方向,从而进一步了解对方关注的内容,达到更加自然的互动式交流。教学双方在对话中可以更加轻松和准确地说出交流的对方在看哪一个屏幕对象,甚至比在普通的白板交流环境中更容易。这种虚拟现实技术的交互式教学方式能够以学生为教学中心,尊重学生个体差异,有效提高教师与学生及学生之间的交流效果,调动学生的主动参与性。

4.建设富有特色的网络教学平台,提供丰富多彩的专题知识和扩展的学习资源。由于当前各学科发展变化都比较大,各学科间相互交叉,学生的知识涉及面也越来越广泛,综合性强,新兴交叉学科与原有学科之间的传承变化都面临着很大的挑战。由于教学的具体内容和对象变化非常迅速,很多问题在课堂上只能点到为止。因此,充分利用虚拟现实的技术,搭建交互式的数字教学平台,可以有效管理丰富多样与不断发展变化的教学资源,为学生提供进一步了解相关知识的课余辅导材料,有效整合、分享国内外各名校的免费教学资源,提供学校各学科教师间、各届学生间以及校企之间的有效沟通平台,形成分享式与定制式结合的学习资源库。随着三网合一以及云计算等信息技术的发展成熟,基于虚拟现实的网络学习资源库也变得更为可行。专题知识由各教师提供最新的相关领域的理论、实践方法等内容,并要随时更新。这些资源库能够有效地传承文化,整合教学资源,为师生及校企、社会提供帮助。