第四章 新技术、新产品
第六节 人工智能技术在城市安全场景中的应用

  当前,随着我国的经济发展进入社会转型阶段,流动人口数量大幅增加,重点人员脱离管制的现象越发严重,尤其是很多重点人员为脱离公安机关管控范围,往往居无定所、人户分离,对社会治安秩序形成了严重危害,加强对重点人员的管控,关乎预防和打击违法犯罪,关乎社会的安定团结,需要从根本上加以重视。重点公共场所容易发生违法犯罪行为及治安灾害事故,是公安机关进行治安管理的重中之重,做好重点公共场所的治安防控,给人民群众营造安全和谐的公共环境,已经成为全社会共同的呼声。社会舆情是社会大众对社会现实的主观反应,是社会发展情况的温度计和晴雨表,加强社会舆情的调查、研判,及时准确把握、评估和引导社会舆情,是将影响社会和谐稳定的舆情危机防患于未然、化解于无形的前提。
  社会公共安全防范工作需要通过强有力的科技手段来支持与保障。近年来,国内外众多企业、科研院所和专家学者对人工智能关键技术投入大量资源进行研究攻关,人工智能所依托的分布式处理、并行处理和高性能网格计算的技术瓶颈得到了突破性发展,形成了一些具有代表性的技术方案体系。可以说,这些技术及其实现方案为城市安全场景中海量视频资源的智能化分析处理提供了有力的技术支持。
  一、人工智能与安防的结合
  安防领域的人工智能主要集中在对人、车、物及其相关的行为场景进行识别、比对、检索和研判分析。而这些工作都离不开视频数据资源。视频数据作为安防行业分布最广、存储最大、使用最多的大数据资源,其非结构化的特征对后期的智能化应用带来很大的障碍。因此,视频结构化是人工智能技术在视频信息分析和处理中的关键手段,该技术的成熟也使得人工智能技术在安防领域的应用得到实质性的突破,人脸和车辆识别、异常行为分析等相关智能分析功能也得以落地使用。
  人工智能技术在安防行业特别是公安智慧警务领域得到广泛应用的一个重要原因是:公安智慧警务建设对智能化应用的迫切需求造就了人工智能技术的强势崛起。但从当前市场应用情况看,将人工智能技术与公安实战业务进行真正融合,切实解决当前公安业务中的痛点问题的产品和解决方案并不多见。因此,用户迫切需要安防企业尽快拿出基于人工智能技术来实现对城市安全场景中重点人员、重点防护场所和社会舆情进行智能化处理和应用的解决方案,利用人工智能技术对城市安全场景中的重点人员、重点车辆、重点物品所产生的海量监测数据进行实时收集、处理、挖掘,并通过深度学习的方法对数据进行建模,建立健全社会治安情报信息分析研判机制,定期对社会治安形势进行分析研判,加强对社会舆情、治安动态和热点、敏感问题的分析预测,加强对社会治安重点领域的研判分析,及时发现苗头性、倾向性问题,提升有效应对能力。
  安防行业广泛的业务应用需求决定了安防人工智能市场具有巨大的发展潜力。随着国家“中国制造2025”产业政策的深入推进,以及国内安防和人工智能企业的不懈努力,人工智能技术在安防产业的应用规模也将进一步的扩大。
  二、应用场景
  人工智能技术在城市安全中的应用场景如下:
  通过城市重点区域部署的大量的视频、卡口、人脸抓拍、门禁、WIFI探针等物联网终端,对重点区域内人脸抓拍、车辆、MAC地址、手机信令进行实时采集监测,通过人工智能大数据平台进行数据处理、机器学习、分析算法建模、大数据分析处理等流程,实现信息与画像的对比。
  通过重点防护场所大数据分析服务对公共场所各类视频、行为和设备等多种类安防数据进行多维分析,根据实时分析数据和重要指标监测,来监控重点场所的现场情况,根据重点场所以及相关联场所的分析结果,结合预案库,对重点防护场所进行事前预警;根据对场所视频内容的语义特征信息,在事前预警、事中追踪、事后取证等环节中实现城市级场景模糊目标的快速分级检索。
  通过人工智能算法对互联网海量信息自动抓取、自动分类聚类、主题检测、专题聚焦,将舆情数据从多种维度进行分析,实现社会治安相关的网络舆情监测信息需求,形成简报、报告、图表等分析结果,为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据,结合预先定义的预警方案,对舆情信息进行预警。
  三、技术创新
  (一)基于规则的智慧数据采集
  基于规则的智慧数据采集可以提高数据收集的有效性。规则是整个智慧采集的核心,也是最终决策的基础依据。通过规则进行分析后,一方面可以将决策或者决策后的数据传输出去,另一方面可以按照决策做出局部报警。
  (二)智能化设备信息融合创新
  利用智能化的技术手段对多个系统获得的监测信息在一定准则下加以自动分析、综合,以完成所需的决策和估计任务。利用多个系统共同或联合操作的优势,提高系统的有效性。
  (三)基于深度学习方法的视频目标分类
  传统的目标检测算法采用“基于滑动窗口的候选区域选择+设计手工特征+分类器”的思路。然而基于滑动窗口的区域选择策略没有针对性,时间复杂度高,窗口冗余。此外,手工设计的特征对于多样性的变化并没有很好的鲁棒性,这类方法大多通过对底层视觉特征,如颜色、轮廓、纹理等特征进行直接加权组合的方式来构造图像特征。而深度学习算法构造出一个多层非线性层叠式神经元网络,能够很好地模拟视觉信号从视网膜开始逐层处理传递,直至大脑深处的整个过程,对输入的图像数据逐级提取特征,通过大量的训练数据进行学习,从而达到提升识别准确率的目的。
  (四)结合时空信息的视频语义信息提取与分级检索
  常见的图像语义信息提取方法采用“图像语义特征+分类器”的架构。然而视频图像内容本身变化的复杂性以及视频图像来源的多源性等因素,使得图像的底层视觉特征描述与高层语义特征之间的对应关系仍然存在极大的分歧,这个问题也被称为“语义鸿沟”。而采用深度学习方法对视频目标进行检测分类,同时结合视频本身的时空信息,对视频进行理解、分析,以提取出人类思维中所能理解的高层语义,并将海量视频的语义信息分级组织成为检索索引的元数据。通过对视频内容的语义理解、语义分析、语义提取的简要概述,构建结合时空信息的视频语义检索模型,建立从底层到高层的语义映射关系,能够跨越“语义鸿沟”并提升视频图像语义提取的精确度,从而更好地完成基于视频时空语义内容的提取、分级检索。

(供稿:魏一金鹏电子信息机器有限公司)

上一篇:第五节 智能视频分析技术在文物安全防范中的应用    下一篇:附录一 已颁布且现行有效的法律、法规、规章和其他规范性文件