浅析智能视频监控技术

2014-03-03 14:43:21 来源:CPS中安网作者:谢珏琪责任编辑: sillyna 收藏本文

当前中国正处在这一跨越的关键时段。智能视频监控只是智能视频技术的一个部分，一个将视频技术引入智能时代的部分。

　　移动目标跟踪

　　移动目标跟踪等价于在连续的图像帧间，创建基于位置、速度、形状、纹理、色彩等有关特征的对应匹配问题。常用的数学工具有卡尔曼滤波、Condensation算法及动态贝叶斯网络等。其中Kalman滤波是基于高斯分布的状态预测方法。不能有效地处理多峰模式的分布情况;Condensation算法是以因子抽样为基础的条件密度传播方法，结合可学习的动态模型，可完成鲁棒的运动跟踪。就跟踪对象而言，跟踪如手、脸、头、腿等身体部分与跟踪整个目标;就跟踪视角而言，有对应于单摄像机的单一视角、对应于多摄像机的多视角和全方位视角;当然还可以通过跟踪空间(二维或三维)、跟踪环境(室内或户外)、跟踪人数(单人、多人、人群)、摄像机状态(运动或固定)等方面进行分类。从跟踪方法的不同讨论跟踪算法。

　　1、基于模型的跟踪

　　传统的人体表达方法有如下三种：①线图法：人运动的实质是骨骼的运动，因此该表达方法将身体的各个部分以直线来近似。②二维轮廓(2D Contour)：该人体表达方法的使用直接与人体在图像中的投影有关，如Ju等提出的纸板人模型，它将人的肢体用一组连接的平面区域块所表达，该区域块的参数化运动受关节运动(Articulated Movement)的约束，该模型被用于关节运动图像的分析。③立体模型(Volumetric Model)：它是利用广义锥台、椭圆柱、球等三维模型来描述人体的结构细节，因此要求更多的计算参数和匹配过程中更大的计算量。例如Rohr使用14个椭圆柱体模型来表达人体结构，坐标系统的原点被定位在躯干的中心，目的是想利用该模型来产生人的行走的三维描述;Wachter与Nagel利用椭圆锥台建立三维人体模型，通过在连续的图像帧问匹配三维人体模型的投影来获得人运动的定量描述，其中，它利用了迭代的扩展卡尔曼滤波方法，结合边缘、区域信息及身体解析约束确定的身体关节运动的自由度，实现单目图像序列中人的跟踪。

　　2、基于区域的跟踪

　　基于区域的跟踪方法目前已有较多的应用，例如Wren等利用小区域特征进行室内单人的跟踪，文中将人体看作由头、躯干、四肢等身体部分所对应的小区域块所组成，利用高斯分布建立人体和场景的模型，属于人体的像素被规划于不同的身体部分。通过跟踪各个小区域块来完成整个人的跟踪。基于区域跟踪的难点是处理运动目标的影子和遮挡，这或许可利用彩色信息以及阴影区域缺乏纹理的性质来加以解决，如McKenna等首先利用色彩和梯度信息建立自适应的背景模型，并且利用背景减除方法提取运动区域，有效地消除了影子的影响;然后，跟踪过程在区域、目标、目标群三个抽象级别上执行，区域可以合并和分离，而人是由许多身体部分区域在满足几何约束的条件下组成的，同时人群又是由单个的人组成的，因此利用区域跟踪器并结合人的表面颜色模型，在遮挡情况下也能够较好地完成多人的跟踪。

　　3、基于活动轮廓的跟踪

　　基于活动轮廓的跟踪思想是利用封闭的曲线轮廓来表达运动目标，并且该轮廓能够自动连续地更新。例如Paragios与Deriche利用短程线的活动轮廓、结合Level Set理论在图像序列中检测和跟踪多个运动目标;采用基于卡尔曼滤波的活动轮廓来跟踪非刚性的运动物体;利用随机微分方程去描述复杂的运动模型，并与可变形模板相结合应用于人的跟踪。相对于基于区域的跟踪方法，轮廓表达有减少计算复杂度的优点。如果开始能够合理地分开每个运动目标并实现轮廓初始化的话，既使在有部分遮挡存在的情况下也能连续地进行跟踪，然而初始化通常是很困难的。

　　4、基于特征的跟踪

　　基于特征的跟踪包括特征的提取和特征的匹配两个过程。一个很好的例子是点特征跟踪，将每个目标用一个矩形框封闭起来，封闭框的质心被选择作为跟踪的特征;在跟踪过程中若两人出现相互遮挡时。只要质心的速度能被区分开来，跟踪仍能被成功地执行;该方法的优点是实现简单，并能利用人体运动来解决遮挡问题，但是它仅仅考虑了平移运动。如果结合纹理、彩色及形状等特征可能会进一步提高跟踪的鲁棒性。另外，Segen与Pingali的跟踪系统使用了运动轮廓的角点作为对应特征，这些特征点采用基于位置和点的曲率值的距离度量在连续帧间进行匹配。

　　目标分类

　　目标分类的目的是从检测到的运动区域中将特定类型物体的运动区域提取出来，例如分类场景中的人、车辆、人群等不同的目标。根据可利用信息的不同，目标分类可以分为基于运动特性的分类和基于形状信息的分类两种方法。基于运动特性的识别利用目标运动的周期性进行识别。受颜色、光照的影响较小。基于形状信息的识别利用检测出的运动区域的形状特征与模板或者统计量进行匹配。

　　1、基于形状信息的分类

　　基于形状信息的分类是利用检测出的运动区域的形状特征进行目标分类的方法。例如VSAM采用区域的分散度、面积、宽高比等作为特征。利用三层神经网络方法将运动目标划分为人、人群、车和背景干扰;Lipton等利用分散度和面积信息对二维运动区域进行分类，主要是区分人、车及混乱扰动，时间一致性约束使其分类更加准确;Kuno与Watanabe使用简单的人体轮廓模式的形状参数从图像中检测运动的人。

　　2、基于运动特性的分类

　　基于运动特性的分类是利用人体运动的周期性进行目标分类的方法。例如Cutler与Davis通过跟踪感兴趣的运动目标，计算出目标随着时间变化的自相关特性，而人的周期性运动使得其自相关也是周期性的，因此通过时频化方法分析目标是否存在周期性的运动特性而将人识别出来;Lipton通过计算运动区域的残余光流来分析运动实体的刚性和周期性，非刚性的人的运动相比于刚性的车辆运动而言具有较高的平均残余光流，同时它也呈现了周期性的运动特征，据此可以将人区分出来。目标识别是系统对之前提取并跟踪的目标进行识别和辨识。要想让系统具有目标识别和辨识能力，需要对系统进行模型训练。就是利用已知的目标特征(如车辆、人员、动物等)，对系统进行训练，系统将会在大量已知的样本信息上了解、学习不同目标的特征(大小、颜色、速度、行为方式等)，这样当系统发现一个目标时，系统将自动与已经建立好的模型进行比对或匹配特征，从而对目标进行识别和分类。

　　行为识别

　　目标的行为识别是近年来被广泛关注的研究热点，它是指对目标的运动模式进行分析和识别。行为识别可以简单地被认为是时变数据的分类问题，即将测试序列与预先标定的代表典型行为的参考序列进行匹配。通过在跟踪过程中检测目标的行为以及行为变化，根据用户的自定义行为规则，判断被跟踪目标的行为是否存在威胁。

　　1、模板匹配方法

　　采用模板匹配技术的行为识别方法首先将图像序列转换为一组静态形状模式，然后在识别过程中和预先存储的行为标本相比较。模板匹配技术的优点是计算复杂度低、实现简单，然而它对于噪声和运动时间间隔的变化是敏感的。

　　2、状态空间方法

　　基于状态空间模型的方法定义每个静态姿势作为一个状态，这些状态之间通过某种概率联系起来。任何运动序列可以看作为这些静态姿势的不同状态之间的一次遍历过程，在这些遍历期间计算联合概率。其最大值被选择作为分类行为的标准。目前，状态空间模型已经被广泛地应用于时间序列的预测、估计和检测，最有代表性的是HMMS。每个状态中可用于识别的特征包括点、线或二维小区域。状态空间方法虽然能克服模板匹配的缺点，但通常涉及到复杂的迭代运算。

　　结束语

　　视频监控系统的核心价值在于智能视频分析技术，由运动目标检测、分类、跟踪和行为识别等几个基本节组成，还包括智能视频检索技术，其中行为识别又包括异常行为检测、异常事件检测以及视频内容理解描述等。近年来，智能视频监控技术取得长足发展，应用领域不断扩大，从自动目标检测到现在的事件检测、自动目标识别，其监控产品也逐渐由模拟化向数字化、网络化与智能化方向发展。

【作者单位：深圳辉锐天眼科技有限公司】

【想第一时间了解安防行业的重磅新闻吗？请立即关注中安网官方微信（微信号：cpscomcn）——安防行业第一人气微信，万千精彩，千万不要错过！！！

中安网官方微信

关键词视频监控视频分析智能化

共2页上一页 1 2 在本页查看全文

提示：试试"← →"实现快速翻页