生活中越来越多的摄像头代替人眼观察物理世界,让视频成为人们感知世界、获取信息的重要媒介。在此背景下,视频拼接、视频融合和鹰眼等概念名词频繁出现在我们的视野中,相关技术正在成为各行各业数字化转型热门且重要的支撑力量。这些技术概念听起来都与视频处理和可视化有关,往往容易让大家误以为“大差不差”,甚至可以互相取代,但实际上视频拼接≠视频融合≠鹰眼≠视频孪生,它们在实现方式、技术细节上均有着本质的区别。
视频拼接
视频拼接是通过技术手段将多个相互之间画面有重叠的视频流通过特征匹配-透视变换-拼接-裁切最后成一路完整的全景视频。拼接画面可以是有畸变的拼接,也可以是无畸变的拼接。它的特点是:视频拼接有多路视频画面,画面重叠部分拼缝过渡平滑,整体是二维(2D)图像。
无畸变拼接
有畸变拼接
视频融合
视频融合(包括单路融合和拼接融合两种技术形态)是将二维(2D)的单路视频或拼接的视频画面与三维模型相结合进行展示。它是通过一系列技术手段:视频图像畸变校正-图像特征点配准-三维建模-渲染融合实现的。它的特点是:三维(3D)的、与建筑结构或地面匹配、可在三维虚拟场景中展示和分析。
鹰眼
鹰眼摄像头技术也被视为“AR”的增强应用,它是将多个摄像头(一般是3~6个)画面做了图像拼接,是视频图像拼接技术的一种硬件集成。它解决了单个摄像头画面覆盖视野有限(太窄或太小),做到了单个硬件输出的视频画面看得更广,但无法与三维模型进行融合。它的特点是:本质是1个2D视频画面(多路视频源图像拼接,单路输出)、图像有畸变(图像中原本直的道路会发生弯曲)、分辨率高、摄像机视野覆盖广。
综合来看,视频拼接、视频融合以及鹰眼本质上都是一种视觉技术,视频拼接和鹰眼都是在解决“看得清、看得广”的问题,视频融合解决“看得好、看得懂”的问题。
视频孪生
视频孪生即视频+数字孪生技术,本质是对数字孪生的创新升级。视频孪生具有以下三种显著能力:
- 视频融合能力:是利用真实的视频图像还原物理世界,是三维的、是动态的、真实的,解决“看得真、看得好、看得懂”问题;
- 视频计算能力:是将视频与物理世界建立起真实的科学对应关系,为各类空间测量和计算服务,如计算视频中的车辆速度、计算水位的变化(水尺刻度识别),飞机的飞行方位(航向),解决的是科学测量和空间计算的问题;
- 位置智能能力:在视频孪生场景中,通过AI识别出图像中的静态、动态目标,匹配引擎天然的经度、纬度、海拔等坐标信息,再将二维坐标转化成三维坐标,实现孪生体数据管理。同时,面向全场景中要素赋予时空属性,实现基于时间+空间位置的全场景要素检索和分析计算,打破数据孤岛,支撑跨镜头、跨系统、跨场景的人、车、地、物、事件、组织的时空理解、仿真及预测应用。
原创文章,作者:hengxin,如若转载,请注明出处:https://www.guangyihengxin.com/news/1317.html