智能监控的未来发展趋势

日期:2021-02-25 15:40:41 | 人气:

智能监控是嵌入式视频服务器中,集成了智能行为识别算法,能够对画面场景中的行人或车辆的行为进行识别、判断,并在适当的条件下,产生报警提示用户。

随着智能监控中对人的运动分析研究和其它相关技术的发展,下述几个方面己经成为未来的发展趋势:

音频与视觉相结合的多模态接口

人的相互交流主要是依据语言,过去的许多工作是语音理解,但语音识别受距离和环境噪声的限制,尤其在机场等高噪声环境,将会严重影响语音识别的性能。人的可视化描述与语音解释一样重要,研究者们正逐渐将语音与视觉信息集成起来以产生更加自然的高级接口。当前一些接口系统在视觉方面仅仅做了如脸的表情、身体姿势等的大尺度分析,但还不能分析大多数人的正常姿势,这意味着人机之间的通讯仅局限于几个特定的姿势,这个局限是人的姿势结构的不易理解造成的,而且跟踪多人的系统由于来自摄像机的分辨率、计算机处理能力和视角的影响而不能准确的估计身体姿势。为了完成优化尺度和广域的分析,可以寻求准确实时的多摄像机的信息融合方法,以便机器更好地理解人的通信行为。现在音频和视频的信号处理相对独立,如何更好地集成音频和视频信息用于多模态用户接口是一个严峻的挑战。

人的运动分析与生物特征识别相结合

在智能房间的门禁系统、军事安全基地的视觉监控系统、高级人机交互等应用中,人的运动分析与生物特征识别相结合的研究日益显得重要。在人机交互中不仅需要机器能知道人是否存在、人的位置和行为,而且还需要利用特征识别技术来识别与其交流的人是谁。

目前的研究主要集中在人的脸像识别、步态识别或特定行为的识别。近距离时一般可以通过跟踪人脸来加以身份识别;如果是远距离的监控,脸的特征可能被隐藏,或者分辨率太低不易识别,然而进入监控领域的人的运动步态是可见的,这激活了步态作为一个独特的生物行为特征应用于人的身份鉴别。由于人的步态具有易于感知、非侵犯性、难于伪装等优点,近来己引起了计算机视觉研究者们浓厚的研究兴趣。

行为理解与描述高层处理的转变

人的行为理解是需要引起高度注意并且是最具挑战的研究方向,因为观察人的最终目标就是分析和理解人的个人行为、人与人之间及人与其它目标的交互行为等。目前人的运动理解还是集中于人的跟踪、标准姿势识别、简单行为识别等问题,如人的一组较通常的行为(跑、蹲、站、跳、爬、指等)的定义和分类。近些年利用机器学习工具构建人行为的统计模型的研究有了一定的进展,但是行为识别仍旧处于初级阶段,连续特征的典型匹配过程中常引入人运动模型的简化约束条件来减少歧义性,而这些限制与一般的图像条件却是不吻合的,所以行为理解的难点仍是在于特征选择和机器学习。现在,用于行为识别的状态空间方法和模板匹配方法通常在计算代价和运动识别的准确度之间进行折中,所以仍需要寻找和8开发新的技术以利于提高行为识别性能的同时,又能有效地降低计算的复杂度。此外,如何借助于先进的视觉算法和人工智能等领域的成果,将现有的简单的行为识别与语义理解推广到更为复杂场景下的自然语言描述,是将计算机视觉低、中层次的处理推向高层抽象思维的关键问题。

目前越来越多的视频被记录下来,但是由于时间的关系,这些视频信息很少会被完整的分析。在这种情况下,智能视频(Intelligent Video,IV)应用程序由此发展起来。新的智能视频(IV)系统可以获取车牌的视频图像并将此信息数字化,然后再与数据库中的内容进行交叉比对。人数统计和绊网则是智能视频(IV)应用的另一些实例。

由于在前端设备中提供了此类智能功能,可直接对原始数据进行分析,并减少工作人员的工作量。智能网络摄像机永远不会空闲,他始终出于警戒状态,等待一个动作的触发来启动录像。移动侦测功能可用于特定的警报设置,以适应各种不同的特殊环境和事件强度。

智能视频将原始视频数据变成可以操作的信息。监控系统提供的智能信息可支持决策者在紧急情况下作出高质量的决策。而类似人数统计等新的商业机会将会出现。