每天穿梭在城市中,无论是步行、驾车还是乘坐地铁,几乎走到哪里都能感受到一道道“目光”从头顶投下——没错,就是那些随处可见的监控摄像头。据相关统计,生活在大城市的人平均每天会“偶遇”监控探头多达数百次。从大街小巷到写字楼、商场、餐厅,这些设备早已成为城市基础设施的一部分。

当然,正是这些或隐蔽或高悬的探头默默值守,才让城市拥有了更强的安全感。它们联网之后,便构成了智慧城市的基础神经网络——每个摄像头就像安全卫士的眼睛,日夜守护着城市的每一个角落。
然而,早期技术的局限性让不少监控摄像头变得“有心无力”:清晰度不足、未联网、缺乏智能分析能力,已难以适应当今的社会经济需求。尽管“眼睛”遍布全城,但城市管理者常常看不清、看不见、看不全、看不懂——这就让智慧城市陷入了“有眼无珠”的尴尬境地。
大脑的进化很大程度上依赖眼睛。人类处理信息,必须先通过眼、耳、鼻、手等器官采集外部数据;眼睛看不见,大脑就无从处理。对智慧城市而言,每个摄像头就是它的眼睛。如果眼睛模糊、不联网、不具备智能分析能力,系统自然无法完成图像数据的深度处理。所以,“有眼无珠”里的“珠”,更确切地说,是指“脑”。
中国工程院院士、北京大学教授高文在2018年3月31日由雷锋网主办的“人工智能安防峰会”上指出:智慧城市系统依赖视频监控,但早期的监控系统基本只为了存储和事后人工查看,没有统一的时间戳,也缺乏准确的地理信息。同时,云端存储的压缩视频是按照图像帧结构组织的,要分析和识别必须先解码,无法直接在压缩数据上检索分析。
解码过程既耗费计算资源,又会带来明显延迟。而且为了传输和存储,大量视频在压缩过程中会丢失许多图像细节特征,导致识别率下降。这也是为什么目前视频监控数据利用率极低——多数系统被设计为存储数据、再由人工离线检查,绝大多数数据在其生命周期内从未被使用过。数据量大,并不等于大数据。
高文院士强调,城市大脑需要智慧之眼。“通过监控摄像头让城市变得更智慧,不只是一个单纯的视频检索或计算机视觉问题,而是面对海量信息和突发事件时,能否迅速响应、降低计算量、有效识别和检索等一整套庞大的系统工程。”
他在大会上提出了“数字视网膜”的概念。承载数字视网膜的摄像头需要完成两件事:一是做好编码,二是为后续识别提取所需信息。数字视网膜既具备影像重构(精细编码视觉内容)的能力,又具备特征提取(面向识别理解)的功能。基于结构化的大数据,融合底层视觉特征与深度学习,可以更丰富地挖掘数据的内在信息,提升分类、检索或预测的准确性。
当然,受当前人工智能技术短板的限制,泛安防+人工智能仍有很多难题需要突破。比如,在海量视频数据中寻找目标——“天网”系统每天产生的图像视频数以亿计,要从中找到可疑的人或车,无异于大海捞针。
此外,传输受限与预警不及时也是痛点。高清、超高清摄像机大量应用后,采集的数据量巨大,传输成本极高,很难第一时间汇集到数据总平台,这给全局预警和搜索带来了困难。以交通拥堵为例,当前交通大数据主要来自导航地图和共享出行软件,而视频智能分析的数据应用仍然较少。
不过,随着传统安防企业在AI技术上的持续投入,大量人工智能创业团队的加入,以及技术应用在安防行业的不断验证与优化,我们的城市大脑一定会越来越聪明,城市也会变得越来越安全。
