微信
投稿

探究图像传感器面对的挑战与理解决方案

2021-05-13 17:03 来源:FPGA技术支持 作者:FPGA技术支持

利用新型的处理硬件架构,以10至100Gbit/s或更高的速度处理视频流。

背景

诸如3D成像,虚拟现实和广播之类的高级视觉系统依赖一个或多个高分辨率,高速相机。这些摄像头系统每秒捕获并传输多个千兆像素,这些像素需要实时处理或压缩。尽管摄像头传感器技术和支持接口正在迅速发展,但是传统的基于PCIe/CPU/GPU的PC体系结构却缺乏以这种数据速率捕获,处理和存储图像所需的性能。

基于高端FPGA的图像采集卡具有超快的收发器和巨大的板载内存带宽,为实时处理和压缩提供了必要的基础设施。开放式FPGA架构允许开发人员定制其采集路径,并嵌入自己的图像处理算法和压缩块。有了Gidel的Proc VisionIDE这样的支持生态环境和开发工具,FPGA代码开发被大大简化和加速,不再需要深厚的FPGA专业知识。因此,视觉系统设计者现在可以以罕见的性能实现定制的、具有成本效益的千兆像素解决方案。

图像传感器正在引领潮流

CMOS图像传感器技术的进步使多百万像素的成像器能够以具有成本效益的价格获得数百至数千FPS的帧率。Gpixel、Luxima Technology、Teledynee2v、AMS/CMOSIS、安森美和索尼等公司正在为这一发展做出重大贡献(见图1)。

探究图像传感器面对的挑战与理解决方案

图1:在通用视频接口标准的有效带宽上的高端图像传感器的分辨率和帧速率。

下一代图像传感器将产生每秒160千兆比特(Gbps)及以上的数据速率。此外,多摄像头的应用已经变得无处不在,特别是在从虚拟现实到广播、监控、医疗成像以及三维或高分辨率的质量检测等领域。例如,一个三维体育广播系统,可能包括30多个摄像头,每个摄像头的分辨率为65MP,速度为30fps。

最新的高端图像传感器和多摄像头应用分别提供每秒几千兆像素和几百兆比特的数据。这些巨大的数据速率需要被实时捕获、预处理、分析,而且往往还需要以高精度同步和低延迟的方式进行压缩和存储--这一要求远远超过了基于CPU架构的能力。相反,这种需求只能通过利用FPGA、GPU和/或CPU的独特能力的新型异构处理解决方案来满足。

高带宽挑战

对于超过20Gbps的传感器数据传输速率,在标准化的相机接口中只有少数选择:25、50或100GigE、多链路CoaXPress v2和PCIe。在20+Gbps时,光缆取代铜缆,将传输距离从25米延长到40公里。

高带宽成像的另一个挑战在于将视频流传输到主机的高性能处理器,无论是GPU、FPGA还是CPU。视频采集卡的主板接口通常是PCIe Gen.3x8,有效带宽仅为48Gbps。此外,在主机处理系统中,CPU/GPU和显卡与主存储器之间的RAM桥必须运行得足够快,以避免帧丢失。智能网卡成功地分配了PCIe上的峰值负载,并大大减少了主机CPU上的工作量,但这往往是以处理能力不足导致的图像帧丢失为代价的。

秒千兆像素实时处理解决方案

想要达到几十上百Gbps的数据速率,除了昂贵的ASIC之外,只有基于高端FPGA的图像采集卡架构才能提供必要的处理性能来克服上述挑战。这些采集卡拥有远甚于传统的预处理步骤,以执行复杂的成像算法,从小波变换一直到深度学习推理和实时压缩。压缩是克服PCIe和主机内存带宽瓶颈的一个强制性功能。

这种高端图像采集卡的设计本身就是一个挑战,特别是在涉及利用来自多个图像区域或多个传感器的数据的算法的实现时。为了规避可能的瓶颈并实现分布式处理的灵活性,图像采集卡必须包括功能强大的收发器,足够的FPGA资源,高机载内存访问权限和快速DMA卸载引擎。

这样的图像采集卡通常包括访问速度为TB/s的FPGA内部存储器,以及访问速度为数百GB/s的10+GBDDR4板载存储器。在FPGA上实现机器视觉算法通常需要在FPGA编程方面有深入的专业知识。此外,在单个FPGA上实现多摄像机采集和处理需要集成多接口,摄像机协议,多源处理算法,存储器控制器,I/O端口控制和主机桥。除了性能优化的架构之外,至关重要的是,图像采集卡还应由集成开发环境(IDE)支持,该集成开发环境使非FPGA专家能够开发成像算法并集成多个FPGA功能块。

高带宽优化的开放式FPGA采集卡

以色列技术领导i者吉德尔(Gidel)拥有近三十年的经验,创建了一个针对超高带宽和多传感器采集而优化的现成图像采集生态系统,使开发人员可以将自己的专有算法代码添加到现有的采集流水线。得益于专用的开发套件,添加图像处理算法和定制采集路径非常简单,甚至可以由非FPGA专家执行。Gidel的开发套件可在不影响性能的情况下极大地加速系统开发。

Gidel的PCIe图像采集卡,模块和载板使视觉系统设计人员可以利用FPGA技术的最新进展,例如Intel的Stratix10和Arria10系列。Gidel的最新Proc10N模块能够同时捕获和处理多达4 x 100 G ig E摄像机或16 x 10 GigE摄像机,并具有精确的低延迟同步。通过以300GB/s的速度访问DRAM,Proc10N甚至可以在带宽要求高的应用中实现实时处理。Stratix 10NX具有出色的矩阵计算功能,带有专用的Tensor块,是高性能推理计算(包括复杂的深度学习网络)的理想选择。

免责声明: 凡注明来源本网的所有作品,均为本网合法拥有版权或有权使用的作品,欢迎转载,注明出处。非本网作品均来自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

精彩评论

暂无评论...
验证码 换一张
取 消

热门作者

东方

简介: 天马行空的文字之旅。

邮箱: liutingting03@hczyw.com

简介: 保持期待,奔赴山海。

邮箱: zhuangjiaxin@hczyw.com

松月

简介: 脚踏实地,仰望星空。

邮箱: wuxiaqing@hczyw.com

合作咨询:15889679808               媒体咨询:13650668942

广州地址: 广州市越秀区东风东路745号紫园商务大厦19楼

深圳地址: 广东省深圳市龙华区五和大道星河WORDC座5F506

北京地址: 北京市朝阳区小关东里10号院润宇大厦2层

慧聪电子网微信公众号
慧聪电子网微信视频号

Copyright?2000-2020 hczyw.com. All Rights Reserved
慧聪电子网    粤ICP备2021157007号