近日,大华股份基于AI的场景流估计算法和光流估计算法再次取得突破性成果,各项指标再次刷新了KITTI Sceneflow、KITTI Flow两项竞赛的全球最好成绩:场景流和光流的3像素错误率指标分别为5.06%、3.79%,指标均创历史新高,持续保持领先水平。
大华股份AI取得KITTI Sceneflow排行榜第一
(来源: http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php)
大华股份AI取得KITTI Flow排行榜第一
(来源:www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow)
场景流算法可同时估计场景中物体的三维位置与三维运动矢量,光流是场景流映射到二维图像坐标系的投影,应用价值广泛。为提升场景流估计精度,大华AI团队优化了一系列算法模块。首先,基于yolact++网络进行实例分割,从场景中分割出行人、车辆、自行车等前景目标,然后基于最新架构的GANet计算初始视差图,得到更精细的视差图,在使用RAFT网络得到精细光流图,最后通过多阈值融合等策略,进一步优化场景流估计结果。
在测评中,场景流和光流算法的效果和计算结果如下:
▲输入图像
▲T0时刻视差图
▲经光流映射后的T1时刻视差图
▲T1时刻到T0时刻的光流图
▲场景流误差图
该项技术已在大华双目摄像机、全景摄像机等设备中得到应用,提升多目摄像机的目标深度数据计算、目标行为分析等算法性能;同时,该技术也成功应用于AR融合领域,实现单个及多个摄像机图像的AR语义融合应用,极大提升了行业解决方案的用户体验。
双目摄像机行为检测应用场景
▲双目图像图
▲视差图
▲光流图(目标三维运动矢量)
AR语义融合应用场景
▲真实图像
▲AR语义融合,增强目标类别、位置、运动矢量等信息
近年来,在算法商业化落地方面,大华积极应用主导个性化AI方案敏捷交付,构建人工智能端到端研发的全链路能力,实现AI从基础能力到算法研发到产业化应用落地,构建了围绕视图智能、3D智能、多维智能、控制智能等核心算法体系,实现了在各业务领域的人工智能算法、产品与解决方案的全面覆盖,赋能百行百业。
大华面向用户需要开放全栈能力,赋能行业生态,并在实战中持续积累人工智能核心技术,针对全场景理解、小规模数据、泛化能力、多任务学习和AutoML等人工智能的技术挑战,开展实践探索,并已取得实战应用成果。
未来,大华股份将继续推动AI技术与各行业场景的深度融合,充分发挥科技创新对百行百业可持续发展的支撑引领作用,推动AI等新一代技术的普及与落地,赋能百行百业数字转型升级。