PLC 工控机 嵌入式系统 人机界面 工业以太网 现场总线 变频器 机器视觉 DCS PAC/PLMC SCADA 工业软件 ICS信息安全 应用方案 无线通讯
深圳市九鼎创展科技有限公司
阅读:664发布时间:2016-6-1
跑分王:Cortex-A17芯片
瑞芯微RK3288处理器采用Cortex-A17,其zui大的特点就是
与Cortex-A15一样采用*乱序执行架构,其性能提升有着*的效果。双指令译码、双地址产生器(AGU)、多指令派发(multi issue)等特别架构的设计,使得Cortex-A17在指令执行效率上有相当大的提升,正是基于以上改进,在同样的频率下,Cortex-A17的单线程性能要比Cortex-A9有40%的提升,而频率高达1.8GHz的RK3288性能较上一代RK3188有50%的性能提升。
在之前RK3188处理器中,瑞芯微使用的GPU Mali-400一直是RK3188的
软肋。而在的RK3288处理器中,GPU采用Mali T76X系列GPU,Mali T764核心zui大特点是采用第三代Midgard架构,相比于T62x/65x系列GPU所采用的第二代MIDgard架构,第三代Midgard架构在内部架构上进行了重新设计,特别是大幅度改变了着色器核心的配置方式;着色器数量高达4个着色器核心,是之前的T654的两倍;2400M/s的像素填充率和300M/s的三角形生成率相对于过去获得了成倍的提升。
瑞芯微RK3288是支持4Kx2K,以及硬解H.265视频的芯片,带给用户清
晰的视觉享受作为更有效率的高清压缩格式,H.265标准已经成为了各视频的救命稻草。与H.264相比,H.265使用了大小浮动的编码单位以及更*的帧内预 知模式,同画质的情况下使用H.265的视频可比H.264节省一半的带宽。瑞芯微RK3288是业界支持4K H.265实时硬件解码的ARM内核芯片,在视频的支持上发挥了其以往的音视频领域的积累优势,真正支持4K视频的输出及播放。[1]
第三代midgard架构,火力更足
mali-t764zui大特色就是采用第三代midgard架构,在内部架构上进行了重新设计,大幅度改变了着色器核心的配置方式。着色器间的内存同步以及核心群间的scu依然保持。不过核心群间依然采用
独立的l2 缓存和snoop单元,彼此之间的通过amba4总线实现,因此可以认为任务的分配可以根据需要实现化。
同时mali-t764还支持gpgpu(通用计算图形处理器)加速复杂和计算密集型算法或操作。rk3288还将在可穿戴设备上大放异彩。rk3288可以辨别出摄像头画面上运动的物体,利用的性能进行实时渲染,从而带来更佳的体验,像图像拼接识别、面部识别、笑容识别,地标识别甚至皱眉识别这样的应用都可以轻易实现。
mali-t764进一步加强了对不同api的支持,正式加入了对opengl es3.0、opencl 1.1、directx 11.1以及renderscript的支持。靠这些新加入的api,集成mali-t764gpu的处理器可以显示更为精细的图形,有机会运行在传统的pc平台,让pc软件和移动软件的相互移植变得更为方便。[3]
支持ARM 帧缓冲压缩格式也是Mali-T764的一大亮点,这让它可以在运行高画质游戏时缓解内存带宽不足的压力。很多采用Mali-400MP4+视网膜屏幕的平板在zui高分辨率模式下都会出现非常卡顿的现象,一大程度上就是显存带宽不足的体现。为解决视频所遇到的内存带宽难题,ARM 开发了 ARM 帧缓冲压缩格式,该格式能够提供快速、实时的无损压缩与解压缩。这降低整个系统对内存带宽的要求,并将相应功耗降低至多达50% 。
此外,Mali-T764在支持OpenGL ES 3.0时还支持ASTC 纹理压缩格式,除了能减少纹理材质的传输大小外,这也让手持设备的高质量游戏得以全面减少纹理材质上的带宽耗损,维持游戏的画面质量又可减少带宽。
苹果新A7处理器采用PowerVR 6核心架构。PowerVR 6架构为统一超标量渲染引擎,着色器阵列设计,以四个着色器为一个SIMD 阵列设计。A7所采用的是IMG PowerVR G6430,4 个SIMD 阵列设计。
瑞芯微RK3288所采用的Mali-T764支持特性并不逊色于A7的PowerVR G6430。Mali-T764采用的是ARM的第三代MIDgard架构,也是采用当前PC上GPU一样的统一渲染架构,特点就是在提升通用处理功能的同时,依然保持足够的图形处理效率,包括有64-bit双精度浮点运算和64-bit整数运算,64-bit寻址,shader单元间的内存同步。不过,相对于PowerVR 6430核心所采用分解矢量引擎和scalar引擎的SIMD构架,Mali-T764的运算管线采用128-bit矢量引擎设计,拥有灵活的管线配置。特别是作为Mali –T700系列的zui高型号,Mali-T764通过单一的调度机制,每个核心群都会分到相同的处理任务,可以根据需要实现性能化。可以说,如果从硬性配置上,两者势均力敌,但在运算管线设计上Mali-T764更胜*。
A7的PowerVR G6430的性能来看,与A6X处理器PowerVR 554MP4相差不大:同频下浮点性能和iPad4上的SGX554MP4相同,三角填充率及纹理性能是SGX554MP4的两倍。
?Mali-T764每个着色器都配有四个ALU(算数逻辑单元)、一个LSU(本地存储单元)、一个纹理单元。而且Mali-T764的四个着色器族组都拥有独立的共享L2缓存的核心群,四个核心群之间则通过单一的dispatcher,每个核心群都会分到相同的处理任务。更重要的是,各个shader均拥有独立的线程调度,可对各自的管线分配来自各个线程的程序指令,从而使得各个管线可灵活用于执行来自各自线程的指令,这样如果有128条管线,那么就可以同时运行128个线程,而Mali-T764的shader单元zui多能够控制800个以上的线程。这种灵活的线程调度方式,让Mali-T764的shader单元拥有更高的运算效率,甚至拥有媲美于桌面PC般的图形性能。
Mali- T760在搭配16个核心600MHz下,色器性能峰值为326.4 GFLOPS、1066M三角形生成率及9600M像素填充率,此时完胜于A7的PowerVR G6430。由于Mali- T764只搭配4个核心,因此性能只有Mali- T760mp16的四分之一,另外mali系列计算浮点为FP16情况下,而其他厂商GPU皆在FP32下计算,因此Mali- T760浮点性能实际上只有宣传数值一半左右的浮点性能,mali T764FP32下浮点为81.6 GFLOPS,实际FP16下浮点大约只有40.8 GFLOPS,而G6230在600mhz下FP16为 76.8GFLOPS,因此T764性能比不上G6230,但差距不太大。
商铺:https://www.gkzhan.com/st145763/
主营产品:嵌入式ARM开发方案,RK3399开发板,S5P6818开发板,RK3288开发板,i210开发板,S5P4418开发板,X210开发板,x4412开发板
智能制造网 设计制作,未经允许翻录必究 .
请输入账号
请输入密码
请输验证码
请输入你感兴趣的产品
请简单描述您的需求
请选择省份