• ARM_Cortex_A8、A9以及高通Scorpion处理器详解


    1.一些背景介绍


    1.1 ARM核心
    ARM核心是主控SOC中的重要部分,系统的日常应用都由ARM核心来完成,因此ARM核心的效能很大程度上跟用户体验有关。ARM公司一般用DMIPS/MHz来标称ARM核心的性能。DMIPS是Dhrystone Million Instructions executed Per Second的缩写,反映核心的整数计算能力。但Dhrystone算法代码本身比较叫,可以完全放到Cache中执行,因此反映的只是核心能力,并不能反映缓存、内存I/O性能。

    能支持智能系统的ARM核心有以下几类:


    ARM9:指令集ARMv5,5级流水线,1.1DMIPS/MHz
    ARM10E:指令集ARMv5,intel获得授权后发展的,如PXA270,PXA210系列,6/7级流水线,1.35DMIPS/MHz
    ARM11:指令集ARMv6,8级流水线,1.25DMIPS/MHz

    Cortex-A8:指令集ARMv7-A,13级整数流水线,超标量双发射,2.0DMIPS/MHz,标配Neon,不支持多核
    Scorpion:指令集ARMv7-A,高通获得指令集授权后在A8的基础上设计的。13级整数流水线,超标量双发射,部分乱序执行,2.1DMIPS/MHz,标配Neon,支持多核
    Cortex-A9:指令集ARMv7-A,8级整数流水线,超标量双发射,乱序执行,2.5DMIPS/MHz,可选配Neon/VFPv3,支持多核
    Cortex-A5:指令集ARMv7-A,8级整数流水线,1.57DMIPS/MHz,可选配Neon/VFPv3,支持多核

    Cortex-A15:指令集ARMv7-A,超标量,乱序执行,可选配Neon/VFPv4,支持多核

    × 目前只有指令集ARMv7-A的核心才能在Android2.2上支持Adobe Flash。
    × Neon是什么?Neon是ARM核心附带的浮点SIMD引擎,可以把它当一个DSP用,可以把它理解为桌面CPU上的SSE,SSE2。合理的利用可以增强处理器在游戏、多媒体中的表现,当然需要软件支持。标准的Neon宽度是64bit。A9的Neon相对A8略有升级。
    如果不使用Neon,就只能有CPU自带的VFP进行浮点运算。标准A8的VFP没有管线化,速度是比较低的。A9的VFP管线化后,效能有明显提升,但还是不如Neon。



    × 超标量:A8 A9 A15都是超标量结构,他们具有两条流水线,一个周期可以发射最多两条指令进行执行。因此同频效能比ARM9 ARM11等高的多。

    × Cortex-A5是Cortex-A家族中的小弟,功耗较低,单位功耗的效能很高,用于代替ARM9和ARM11占据低端市场。
    Cortex-A15是最新发布的,作为高端产品出现,目前资料不多。

    × Scropion是高通根据Cortex-A8修改的。关键的特点是同频下比A8节能30%,或者同功耗的频率高25%。
    Scorpion具有部分A9的特性,如乱序执行,管线化的VFP,支持多核。此外,Scorpion的Neon SIMD引擎(高通称之为VeNum)宽度为128bit,是A8和A9的两倍,能提供更强劲的浮点运算支持,并且在不需要的时候可以关闭一半变成64bit以节省能源。总体上,Scorpion是具有部分A9特性的A8,高频率节能浮点加强版。




    1.2 工艺与频率、功耗
    这三者是密切相关的,当然频率与SOC的后端设计也有很大关系。
    根据参考文献,45nm工艺可以比65nm节省30%的能耗。
    45nm Scorpion在1.0GHz、1.2GHz和1.5GHz下的典型功耗是350mW、420mW和650mW,其中1.5GHz下已经需要加压,功耗上升更多。根据以上信息我们可以推测出



    Cortex-A8虽然性能强劲,但不是省油的灯。于是新一代mid主控在45nm、55nm下动辄1.2GHz的主频,能耗有点让人担心。
    当然,如果采用的GP工艺,可能会好些。同样制程的工艺,可以分为LP和GP。
    LP是Low Power,降低漏电,使得芯片在闲置状态下的能耗最低。
    GP是General Purpose,可以在相同的满载能耗下达到比LP更高的频率,但是闲置状态下功耗高。

    国际大厂用于手机的SOC一般都采用LP工艺,以降低待机功耗,毕竟手机大部分时间都在待机。



    1.3 视频的“硬解”与“软解”
    在Android下,个人认为硬解就是通过芯片自带的加速器进行解码,无论用的是DSP还是硬布线的解码器。
    软解就是通过软件使用ARM核心进行解码,ARM作为一个通用核心做视频解码,自然效能不会太高,并且依赖软件的算法,一般普遍使用的就是FFMPEG对ARM进行优化,调用neon等。

    不过就我个人的使用经验而言,1GHz的Cortex-A8处理器,使用rockplayer,vplayer等基于FFMPEG的软件解码,只能勉强解码480p的视频。对于848×480,24分钟100M左右的RMVB视频,大部分时间都无法达到满帧,在遇到高码率的动态场景时,帧数降到个位数,会有很明显的卡顿掉帧。
    在Tegra 2的A9平台上表现稍好,仍不能满帧。估计是播放软件无法完全利用2个核心,如果两个核心充分利用,解决480p RMVB应该没有问题。

    总体而言,1GHz A8处理器软解RMVB基本是RK27 MP4的水平。如果你的眼睛比较挑剔,就要注意了。一些A8软解720p RMVB流畅的说法,基本都是不实际的。


    1.4 3D性能与内存带宽 


    2 .新一代主控简介

    更新:2011/05/30 修订Tegra2/三星Orion/OMAP4/AML/TCC8803/RK29/S5PV210部分内容
    更新:2011/04/21
    ==========ARM11========================

    VIA WM8650

    猜测为65nm工艺
    ARM11 600MHz,300MHz DSP,支持720p硬件解码
    256M DDR2,位宽未知
    GPU未知

    VIA的新一代芯片,WM8505的升级版。ARM核心从ARM9 300/400MHz升级到ARM11 600MHz,并且能进一步提升到800MHz,性能基本达到RK2818和TCC8902的水平。视频能力从基本没有提升到720p硬件解码,虽然相对TCC的1080p解码有差距,但也达到了RK28的水平。
    软件方面,终于提供了Android 2.1的支持,相比上一代的WM8505只能支持Android 1.6有了进步。但是在A8/A9主控搭载Android 2.2/2.3逐渐普及的趋势下,这款方案又将过时,只能作为低端入门的选择。据报道,售价将在550元以下。

    ==========Cortex-A8========================

    Freescale i.MX515



    65nm工艺,其中ARM核心为GP工艺,视频解码部分为LP工艺

    Cortex-A8 800MHz, 256K L2 Cache
    512M DDR2,32bit
    视频子系统:硬解
    多格式,H.264,VC-1,MPEG4,RV最高720p(大部分开发商都没做RV的硬解支持),实测可播放部分1080p视频

    GPU: Adreno 200(AMD Z430)
    三角形生产率:27M
    像素填充率:166M


    当然,i.MX515不算什么新芯片了,鉴于其产品上市不久,就一起说说吧。国内的515产品基本都是山寨产品,似乎缺乏原厂支持,开发都靠山寨开发商。于是就有固件保密啊之类的新闻,一旦山寨开发商转向RK2908,后续支持也让人担心。GPU性能虽然很一般,但与高通手机芯片的GPU一致,软件支持度不错,但由于山寨平板采用了800*600的分辨率,这方面可能存在一定的兼容性问题,此外游戏中重力感应等也需要一定的调试。视频能力除了缺少RV硬解,其他够用。Android 2.2系统配合A8核心在网络浏览和Flash支持上都问题不大。但目前山寨产品的续航还存在问题,使用和待机时间较短。此外软件上的bug也不少。
    随着新一代的S5PV210,RK2908和TCC8803上市,此方案的产品将进一步进入千元以内,成为最低价的A8产品。


    Rockchip RK2908


    55nm工艺,猜测为GP

    Cortex-A8 1GHz/1.2GHz, 512K L2 Cache
    512M DDR2/DDR3,32bit
    视频子系统:硬解,猜测为Ceva MM3000
    多格式,H.264,VC-1,MPEG4,RV,AVS,VP8最高1080p

    GPU: Vivante GC800
    三角形生产率:最高60M
    像素填充率:未知,推测600M

    代表:酷比U9GT,台电T760,原道N10,蓝魔W15

    最近红红火火的RK29,瑞芯微没少打广告,大有秒杀高通苹果之势。瑞芯微宣传的亮点,就是高主频A8核心,1080p以及WebM视频支持以及高性能的GPU。总体来说,芯片规格还是很不错的。

    自然,凭借1.2GHz的高主频,得分比1GHz的产品高是正常的。不过呢,在三星、TI等厂家使用45nm工艺制作的芯片,标称频率普遍为1GHz的情况下,RK的55nm芯片能标称1.2GHz,想必是用了GP工艺才能到如此高的频率,尽管如此,相信功耗的代价同样也不小。好在RK29是主攻MID市场的,MID不像手机有大量的时间在待机,牺牲点待机功耗也问题不大。只是如果上市芯片个个加压跑1.2GHz,我想功耗方面有所牺牲,对于55nm的RK29来说,1GHz还是比较合适的频率吧。

    目前可以确认采用的是TSMC的55nm LP工艺,所以现在出来的产品频率不是很能上去,第一批产品普遍在800MHz。得益于512K缓存,同频下nbench整数性能略高于AML,而内存性能和浮点性能不如采用A9核心的AML。有部分产品通过固件更新提升到了1GHz,但nbench得分貌似没有提升,有待进一步关注。此外RK29发热不小,普遍用导热胶与金属屏蔽壳相连,以增加散热。

    RK29支持VP8 WebM。能支持这个编码的视频模块,一是google自家的On2的视频解码硬核,另一家是Ceva的MM3000。考虑到RK29还标称支持AVS,那么只剩下Ceva MM3000了。想起RK28用的Ceva MM2000,这次继续用Ceva的视频解码可能性也是挺大的。
    之前的消息是,RK29的3D部分使用了Vivante的GC800.GC800是盈方微IMAPX200系列使用的GC600的更高阶版本,在40nm GP工艺下可以达到575MHz的工作频率,提供57M的三角形生成率和575M的像素填充率。40nm LP 只有315MHz的频率。只是RK29使用的55nm工艺是否能让GC800运行在如此高的频率?抑或是使用了更高阶的GC1000?或者最高60M仅仅是GC800的“最高”?这些我们都不知道,等真正的产品上市。

    RK29可谓是对RK28的一次全面升级,从ARM核心上,视频解码上和3D加速上。但是RK29的真正对手不是三星之类的,恐怕是后面的TCC8803.RK在Android系统软件方面的积累是有目共睹的,相信凭借软件开发实力,联合众多厂商能在下一轮产品的市场中占据大头。
    现在看来,RK29的最大对手是AML。RK29在进一步更新固件后,3D性能得到了比较好的发挥,gameloft的大部分作品已经可以流畅运行,在兼容性上领先于AML



    Telechips TCC8803




    45nm工艺

    Cortex-A8 1GHz/1.2GHz
    512M DDR2/DDR3,32bit
    视频子系统:硬解,猜测为ARM Mali-VE6
    多格式,H.264,VC-1,MPEG4,RV最高1080p

    GPU: Mali-200,主频320MHz,
    三角形生产率:20M
    像素填充率:未知

    代表:万和T6

    TCC8803是TCC89xx系列的升级版。采用的ARM核心升级到Cortex-A8,主频1GHz,45nm工艺。由于Telechips跟ARM关系不一般(TCC89xx开发板貌似就是ARM Mali的参考板),猜测TCC88xx中会继续使用ARM提供的图形核和视频模块。
    因此,很可能继续使用与TCC89xx相同的Mali-VE6,提供优秀的全高清解码支持。唯一的消息是解码能力提升到了1080p 50fps,大概得益于频率的提升吧。
    GPU部分,唯一的消息是主频320MHz。由于Mali-T604发布没多久,采用的可能性较小,很可能是Mali-400 MP,三角形生成率30M,像素填充率为275M乘以片段引擎个数(1-4个)。不过320MHz对于45nm来说频率并不高。
    已经确认是mali-200,和TCC89xx一样。与RK29,AML相比,GPU部分是落后了的。性能上也确实不如。
    传言山寨供应商将把TCC8803拉到很低的价格,Telechips原厂也来势汹汹,激烈的竞争不可避免。不过原厂毕竟远在韩国,不知道这次的支持度如何,还是又得靠山寨开发商撑起天下?
    目前TCC8803特点不突出,产品较少。


    中芯微 VC882
    工艺未知

    Cortex-A8 1GHz/1.2GHz, 256K L2 Cache
    512M/1G DDR2,猜测为32bit
    视频子系统:硬解
    多格式,目前有720p

    GPU: Vivante GC400
    三角形生产率:最高14M
    像素填充率:小于150M

    代表:海纳M8

    虽然海纳M8把1280×768八寸电容屏做到了888元,价格还是挺有杀伤力的。但目前视频能力并不明朗,而采用的GPU为GC400,性能仅RK29的GC800的一半不到,相比之下是个短柄了。
    总的来世,可以看作是个国产TCC8803,相对主流的Cortex-A8 1GHz,外加低端的GPU。适合上网的用户。

    Samsung S5PC110/S5PV210
    45nm工艺,LP

    Cortex-A8 1GHz,512K L2 Cache
    512M DDR2,64bit,或者32bit DDR2 + 32bit OneDRAM
    视频子系统:硬解,PowerVR VXD370
    多格式,H.264,VC-1,MPEG4最高1080p

    GPU:PowerVR SGX540
    三角形生产率:90M
    像素填充率:1000M
    代表产品: 三星Galaxy Tab,魅族m9

    上一篇文章已经介绍过,已经量产芯片中的最强A8,同时配置的GPU SGX540极其强悍,唯一能与之匹敌的就是nVIDIA Tegra 2的GPU了,而软件支持度上SGX系列更有优势。总体来说是一颗全面且强悍的芯片。
    目前山寨产品已经上市,有些零碎的消息,也有些争议,具体表现还有待确认。只是山寨方案商的软件总是有那么点让人不放心。

    而Galaxy Tab定价较高,等待普及版的出现,以及小尺寸的Galaxy Player。试玩Tab后整体很流畅,但部分细节还有待三星进一步优化。

    目前发现,山寨/国产小厂的视频能力跟三星原厂有差距,一些720p都不能流畅。

    TI OMAP3620/30/40
    45nm工艺, LP

    Cortex-A8 800MHz/1GHz,256K L2 Cache
    RAM: 256/512M mDDR2,32bit

    视频子系统:IVA2+,基于C64x+ DSP,430MHz
    多格式,但除去爱可视,很多厂商都没做解码
    MPEG4可达720p,其余格式在480p水平
    3620只带IVA2,解码能力更低,最高480p

    GPU:PowerVR SGX530
    三角形生产率:14M
    像素填充率:280M
    代表产品:爱可视43 70 101,moto的droidX droid2手机,B&N nook color

    基本就是OMAP3430的45nm版本,规格看来比较一般。不过采用此产品的厂商软件开发都做的不错,重点说说爱可视70,虽然RAM只有256M,实际使用流畅度挺高,视频部分480p解码也基本够用,但是RMVB分辨率被限制在720*576实在令人苦恼。总体来说,此方案的产品完善度都不错,基本上都是正规大厂产品,使用上可以放心,但价格都不低。

    ZiiLABS ZMS-08
    45nm工艺, LP

    Cortex-A8 1GHz,256K L2 Cache
    RAM: 512M DDR2,32/64bit

    视频子系统:基于干细胞计算阵列,多格式1080p


    GPU:基于干细胞计算阵列
    三角形生产率:未知
    像素填充率:1000M
    代表产品:创新ziio 7 10 优派VB730


    创新搞的玩意,前一代是ZMS-05,除了自家开发用的蛋蛋,没啥产品出现。
    A8 1GHz,没有独立的视频处理、图像处理、音频和GPU模块,全部通过48个SIMD阵列的编程实现。可编程的阵列具有很强的计算能力,通过软件实现各种功能,并且很容易实现升级。目前只有些测试分数,qudrant的得分还是相当高的,产品尚未上市。

    实际使用后速度令人满意,GPU兼容性也比较出色,视频能力也达到了1080p,与三星蜂鸟类似。但只有配备电阻屏的产品。

    ===============Scorpion==============
    Qualcomm MSM8255
    45nm工艺,LP

    Scorpion 1GHz,256K L2 Cache
    512M DDR2,64bit
    视频子系统:硬解多格式,720p

    GPU:Adreno 205
    三角形生产率:41M
    像素填充率:245M
    代表产品:HTC desire HD(手机)

    虽然这是款手机芯片,也拿过来一起说说。高通的新款芯片,45nm工艺频率不变,相对能耗更低些。主要的特点是内存位宽增加到64bit,配合升级的GPU,3D图形性能有了很大进步,已上市芯片中仅次于三星Hummingbird(S5PC110)和Tegra2,在一些测试中还能接近三星S5PC110。



    Qualcomm MSM8650A
    45nm工艺,LP

    Scorpion 1.3-1.5GHz,256K L2 Cache
    512M DDR2,64bit
    视频子系统:硬解多格式,720p

    GPU:Adreno 205
    三角形生产率:41M
    像素填充率:245M
    代表产品:联想lepad

    基本就是45nm Snapdragon的平板版本,频率提升至1.3-1.5GHz,同时提供了高分辨率屏幕的支持。

    Qualcomm MSM8260
    45nm工艺,LP

    双核Scorpion 1.2-1.5GHz,512K L2 Cache
    512M DDR2,64bit
    视频子系统:硬解多格式,1080p

    GPU:Adreno 220
    三角形生产率:88M
    像素填充率:490M
    代表产品:HTC sensation

    高通的首款双核,由于Scorpion核心基于Cortex-A8改良,同频性能不如Cortex-A9,凭借高主频与市场上的A9处理器保持接近的性能(1.2GHz对A9 1GHz;1.5GHz对A9 1.2GHz),图形性能在前几款新品的基础上进一步提升。其每个核心的运行速度提高到了1.2GHz,由新的超低功耗45nm工艺进行生产,支持HSPA+,内置有GPU芯片,支持使用Open GLES 2.0和Open VG 1.1技术的3D/2D图形引擎,支持1080P高清视频编解码和24位色WXGA分辨率显示输出,整合低功耗GPS芯片和音频引擎芯片。
    ==============Cortex-A9====================

    AMLogic AML8726-M
    65nm LP工艺,中芯国际
    Cortex-A9 800MHz,128K L2 Cache,Neon
    512M DDR2,32bit
    视频子系统:硬解多格式,MPEG4,VC-1,H.264,RV等,最高1080p

    GPU:ARM Mali-400
    三角形生产率:25M
    像素填充率:250M
    代表产品:蓝魔W10,智器T10,艾诺novo8

    即将上市的一款产品,其产品的工程机已经频频亮相,也有部分媒体的评测已经放出。
    使用65nm工艺的单核Cortex-A9,属于Cortex-A9中的中端配置,考虑到A9核心2.5DMIPS/MHz的性能,相比Cortex-A8核心2.0DMIPS/MHz,这颗A9理论上具有和1GHz A8类似的性能。虽然L2缓存较小,但在实际使用中,个人感觉不出影响,流畅度令人满意,达到市面上高端A8的水平。

    视频部分为AMLogic自家的硬解模块。AML的MP4产品性能大家有目共睹,实际使用发现视频性能也相当强悍,支持格式丰富,同时应付高码率的蓝光原碟也毫无压力。
    AMLogic还为之配备了独立的音频DSP模块,可以降低音频解码时ARM核心的负担,实测7.1声道的蓝光LPCM也能流畅解码。
    此外,该芯片还集成了GPS基带,支持SATA接口,在高清机方面也可以应用。

    GPU部分为ARM的Mali-400,但似乎只配置了一个片段引擎,故像素填充率为250M,相比Snapdragon一代和OMAP3系列还是要高的,但跟三星Hummingbird等高端主控还是有差距。游戏兼容性通过第三方插件有了显著的提升。

    W10上市价为1199,目前看来此方案售价不会太高,赶在RK29和TCC8803之前上市,凭借芯片原厂的优化,也将会是山寨i.MX515和山寨S5PV210的有力对手。

    W10团购699,艾诺novo8配备1280×768屏幕+5点电容,999元,性价比较高。

    nVIDIA Tegra 2 250
    40nm工艺,LP

    双核Cortex-A9 1GHz,1MB L2 Cache,无Neon
    512M/1G DDR2,32bit
    视频子系统:硬解多格式,MPEG4,VC-1,H.264等,最高1080p
    但对H.264的支持并不完善


    GPU:GeForce ULV
    三角形生产率:90M
    像素填充率:1200M
    代表产品:东芝AS100 万利达zpad moto XOOM

    目前唯一量产并且产品大量上市的双核A9处理器,先进的40nm工艺。A9双核性能确实强悍,实际使用表现也相当出色。
    GPU部分规格相对Tegra1基本上翻倍了。采用了4个pixel shader和4个vertex shader,NV称之为8核,实际要说只能算4核吧……
    图形核心内部增加了大量的缓存,其中包括一些新一代桌面GPU才有的技术,例如像素缓存,这是nVIDIA在Fermi(GF100)才引入的配置。
    此外,Tegra 2的GPU具有更高的可编程性,不仅可以实现OPEGL,也可以实现Adobe Flash的一些渲染,用于加速Flash。大概这就是Tegra 2设备需要使用特别的Flash插件的原因吧。
    NV自己的测试显示Tegra 2的GPU有明显优势。不过普遍认为实际表现中,Tegra 2的GPU比SGX540快那么一点点。总的来说,Tegra 2的GPU和SGX540依旧是目前市面上最快的GPU。虽然目前软件支持上,Tegra 2还不如SGX系列,但随着nVIDIA的努力推广和厂商、Google的认同,Tegra 2的GPU前景还是挺不错的。
    一个令人遗憾的地方是,Tegra 2仅仅具有32bit位宽的DDR2控制器,相比之下,它的竞争对手都搭配了64bit(双32bit)的DDR2控制器。但是NV声称他们擅长设计GPU,即使在较低的内存带宽下也能很好的发挥性能。NV不采用双通道设计的原因是为了保持省电。

    Tegra 2采用具有桌面特性的GPU的另一个好处是可以具有完全的Flash加速,这点在刚才已经提过了。
    当然,i.MX515不算什么新芯片了,鉴于其产品上市不久,就一起说说吧。国内的515产品基本都是山寨产品,似乎缺乏原厂支持,开发都靠山寨开发商。于是就有固件保密啊之类的新闻,一旦山寨开发商转向RK2908,后续支持也让人担心。GPU性能虽然很一般,但与高通手机芯片的GPU一致,软件支持度不错,但由于山寨平板采用了800*600的分辨率,这方面可能存在一定的兼容性问题,此外游戏中重力感应等也需要一定的调试。视频能力除了缺少RV硬解,其他够用。Android 2.2系统配合A8核心在网络浏览和Flash支持上都问题不大。但目前山寨产品的续航还存在问题,使用和待机时间较短。此外软件上的bug也不少。
    随着新一代的S5PV210,RK2908和TCC8803上市,此方案的产品将进一步进入千元以内,成为最低价的A8产品。
    视频部分,规格上VC-1,MPEG4等都是支持的挺好的,但是H.264的支持比较一般,虽说是1080p,但是规格有很大限制。
    配备了A9双核,理论上软解视频也有优势,但是目前尚未有一款
    软解播放器可以很好的利用Tegra 2 的双核,相信如果双核性能得以发挥,软解通吃480p视频(包括RMVB)应该问题不大。
    目前使用moboplayer,Tegra2已经可以很好的播放480p RMVB视频

    音频部分使用了硬件解码,支持AAC-LC, AAC+, eAAC+,  AMR-WB,AMR-NB, WMA7, WMA8, WMA9, and WMA10,  MP3, PCM/WAV and SBC. Tegra 2 encodes AAC-LC,  AMR-WB, AMR-NB,  PCM/WAV and SBC

    Tegra2集成了大量专有的处理单元,因此NV省去了A9的多媒体浮点加速的Neon协处理器,使用了VFPv3浮点单元。

    总的来说,Tegra 2抢占了上市的先机,量产出货领先其他芯片商至少半年,得到了厂商和Google的支持,因此优势还是比较明显的。

    TI OMAP4430/4440
    45nm工艺,LP

    双核Cortex-A9 1GHz,1MB L2 Cache,Neon
    DDR3,64bit
    视频子系统:硬解多格式,MPEG4,VC-1,H.264等,最高1080p
    附带精简的C64x+ DSP用于新格式的解码


    GPU:PowerVR SGX540
    三角形生产率:90M
    像素填充率:1000M
    代表产品:黑莓playbook

    参数看来,在我心中是一款比较完美的A9产品,同样强悍的双核A9 1GHz,64bit DDR3高带宽有助于图形性能的进一步提升。

    1080p硬件解码单元,同时和Tegra2一样搭配了专用音频处理单元。此外,TI继续保留了Neon单元用于浮点加速。视频解码已经不需要C64x+ DSP参与,但TI还是将它适当精简后保留了下来,利用它的可编程性加速一些固化硬件单元不能处理的应用。

    此外,TI同样配置了2个Cortex-M3处理器,用于整个SOC的任务调度和功耗管理。可以说,这是一款非常值得期待的产品,但是距离上市恐怕还有相当的时日。

    playbook实际表现很不错,但没有充分发挥视频性能。期待android产品上市

    Samsung Orion/Exynos 4210
    45nm工艺,LP

    双核Cortex-A9 1GHz,1MB L2 Cache,Neon
    正式发布时为1.2GHz
    DDR3,64bit
    视频子系统:未知,1080p

    GPU:ARM Mali-400 MP
    三角形生产率:30M
    像素填充率:1100M

    代表: galaxy SII

    三星的新芯片,45nm工艺,强悍的A9双核。不过这款产品更像是向ARM示好的样品,三星没有使用S5PC110中的强大的SGX540 GPU,而是使用了ARM的Mali,相比之下三角形生成率并不如前者。目前也处于样片阶段,离产品上市还有很长一段时间。
    因为这款产品的GPU在A9级别中相对平庸,猜测三星不会放着强悍的SGX系列不用,有可能会推出不止一款A9芯片。

    产品出来后,实际性能相当强悍。据传三星将mali-400的频率提升了一倍,测试得分在SGX540的1.5-2倍左右。同时视频解码能力与蜂鸟基本一致,达到多格式1080p流畅解码。通过moboplayer能流畅软解720p H.264视频,达到了新的高度。同时flash在线播放也达到了新的高度,做到了基本通吃,包括在线的1080p flash能通过硬件解码流畅播放。
    缺点是Mali-400的兼容性尚不如SGX和Adreno系列,此外核心面积很大,达到了118mm2,成本上不具有优势,功耗也令人担忧(满载发热明显)。

    Apple A5
    45nm工艺,LP,三星代工

    双核Cortex-A9 1GHz,1MB L2 Cache,Neon
    内存系统未知,应该是64bit DDR2或DDR3
    视频子系统:未知,1080p

    GPU:PowerVR SGX543 MP2
    三角形生产率:70M
    像素填充率:2000M

    代表机型:ipad2

    很强悍的A9双核,外加强悍的543 MP2 GPU,ipad2又一次走在了前列……不知道这次三星会不会出一个类似的芯片?
    缺点就是:面积实在很大……SGX543 MP2面积不小啊

    NEC(瑞萨半导体)
    40nm工艺,LP

    双核Cortex-A9 533MHz,256KB L2 Cache,Neon
    内存 32bit DDR2 533
    视频子系统:未知,1080p

    GPU:PowerVR SGX530
    三角形生产率:14.7M
    像素填充率:500M

    代表机型:

    具体规格:
    40nm工艺,16x16mm FPBGA,393pin (0.65 pitch)

    -CPU: Cortex-A9 (I-cache: 32 Kbytes, D-cache: 32 Kbytes)
    533 MHz @1.1V core voltage, 666
    MHz@1.2V
    core voltage  //40nm为啥跑这么低的频率?难道是为了超级省电
    Level2 cache memory: 256 Kbytes.  //二缓不多也

    视频:全高清妥妥的,都到30fps,没有RV也是妥妥的……
    H.264 decode: BP/MP/HP Full HD(1920x1080)
    MPEG2 decode: MP Full HD(1920x1080)
    MPEG4 decode: SP/ASP Full HD(1920x1080)
    VC-1 decode: SP/MP/AP Full HD(1920x1080)
    MP3, AACHE-AAC,WMA decode
    AC-3decode Dolby digital 5.1ch

    3D: PowerVR SGX530@200MHz
    14.7M的三角形,500M的像素填充率  (有点落后了的说……)

    32bit 内存总线,最高到DDR2-533

    其他就是图像引擎啥的了

    好吧,一颗低端双核A9,两个533加起来是1GHz……(可以这样算么),另外搭配的GPU是SGX530,也够老的了……
    目标市场大概是车载?另外40nm跑这么低的频率应该超级省电吧……价格貌似也不贵

    Ambarella(安霸) iOne
    45nm工艺,LP

    双核Cortex-A9 1GHz,1MB L2 Cache,Neon + 533MHz ARM11 用于协处理
    内存系统未知,应该是64bit DDR2或DDR3
    视频子系统:H.264, MPEG-2, DivX 和 VC-1,1080p

    GPU:PowerVR SGX540
    三角形生产率:--M
    像素填充率:1000M

    Ambarella(安霸)成立于2004年,主攻低功耗以及图像处理芯片市场,这个芯片还支持3D影像,1080p影片播放,500万像素、30fps的摄影镜头控制,并且整合包括Wi-Fi  802.11n、蓝牙、GPS、FM以及移动电视的无线支持,看着配置还是挺均衡的,目前据说也有方案商在开发相应的产品,不知道啥时候能上市。


    nVIDIA Tegra3  “全球首款移动四核处理器”Tegra 3,主频达到1.5GHz,运算能力13800MIPS,是目前Tegra 2的整整3倍。其平板机版本T30拥有3倍性能的集成图形核心,支持1920x1200分辨率屏幕,蓝光视频,以及超低功耗CPU运行模式。而手机版本AP30则可选四核或双核版本,支持1366x768分辨率屏幕。两款Tegra 3都已在去年四季度出货样品,今年秋出货。

    3.总结下各个芯片的规格

    市面上MID产品很多,不过硬件是一款产品的基础,其中主控SOC又是硬件的心脏,所以这里简单总结下各个芯片的规格,共大家选购产品的时候参考。

    *3D部分三角形生产率仅供参考……因为跟内存带宽有关,芯片厂商往往公布的,有些是图形IP核的峰值(提供足够内存带宽的性能),而实际的芯片内存带宽往往有限,达不到理论值。即使同一款芯片,不同的方案采用不同的内存配置,比如DDR或者DDR2,造成的带宽区别也会显著的影响3D性能。
    **有错请跟帖指正哈
    *** 图片均来自网络
    =============================================
    ARM9系列
    经典的ARM9核心,较小的核心面积带来较低的成本,提供约1.1DMIPS/MHz的性能。
    相对比较省电,但难以冲击更高的频率,因此整体效能有限。
    =====================================================
    ARM11
    同样经典的ARM11核心,提供约1.2DMIPS/MHz的性能。
    加长的管线可以冲击更高的频率(1GHz),但与此同时功耗的增加也比较显著。
    =================================================
    Cortex-A8
    ARM首款超标量CPU,双发射顺序结构,带来2.0DMIPS/MHz的效能。
    普遍带有256KB的L2缓存,加上600MHz-1GHz的高频率,相对ARM9和ARM11有显著的提升。
    Cortex-A8标配Neon单元,通过SIMD指令集大大加强浮点性能,可以实现不少DSP的功能。
    与此同时,相对高昂的授权费用和较大的核心面积,使得Cortex-A8 SOC的成本相对较高,作为定位中高端的产品出现。
    三星S5PC110/S5PV210
    45nm工艺

    优化的Cortex-A8 800MHz/1GHz,512K L2,Linpack 8-8.5(1GHz)(2.1系统)
    RAM: 512M mDDR2,32bit

    视频子系统:PowerVR VXD370
    多格式,H.264,VC-1,MPEG4最高1080p
    通过软件解码能勉强支持480p多格式流畅

    3D加速: PowerVR SGX540
    架构:TBR,统一渲染架构
    特性:OPENGL ES2.0/1.1,OPENVG
    三角形生产率:90M
    像素填充率:1000M

    代表机型:三星i9000,Galaxy Tab
    采用类似的A4芯片的有iPad、iPod touch4、iPhone 4

    个人观点:


    毫无疑问,S5PC110(代号HammingBird)是目前最强的Cortex-A8芯片。S5PV210和S5PC110只是封装上的区别,本质上并没有多少的变化。前者封装尺寸较大,适用于平板和上网本,后者的小尺寸封装适用于手机。

    这款新处理器是三星与Intrinsity公司共同研制的(Intrinsity公司是一家芯片设计公司,目前已经被苹果收购),Hummingbird的Cortex-A8经过了三星的改进,同频率下具有更高的效能(+10%-20%),同时配置了512K的L2缓存,是其他Cortex-A8的两倍(Apple A4更是配备了640KB的L2缓存)
    3D部分配置了主流而强劲的SGX540,实测性能领先其他Cortex-A8产品1倍以上,基本不用担心有游戏玩不了。
    视频解码部分,苹果比较吝啬,依旧是720p H.264 MP4解码。不过三星的Galaxy S可以支持多种格式多种封装的解码,包括热门的MKV封装。不过并不支持RMVB的硬件解码,只能通过软解实现480p。
    这颗芯片的强劲性能显然是定位高端的。三星的Galaxy Tab的具体价格也不得而知。11月或12月,国内方案商的S5PV210产品可能会上市,让我们拭目以待。


    A4处理器采用了节省空间的PoP叠层封装,采用了Cortex-A8架构运算核心,集成了PowerVR SGX 535显示芯片。用于iPhone4的A4芯片集成了双路低功耗的256MB RAM总共512MB RAM,其中一路直接与PowerVR SGX 535显示芯片相连,最大限度的发挥出显示芯片的能力(用于iPad的A4芯片则集成了双路低功耗的128MB RAM总共256MB RAM),而比A4的PowerVR SGX 535显示芯片规格更高,集成PowerVR SGX 540显示芯片的三星S5PC110芯片,并没有采用显示芯片直连RAM的设计,其实际表现相比标称性能会打些折扣(实际上除A4外,再无其他产品采用此种设计)。
         PowerVR SGX 535标称具有着28MPolys/s的多边形渲染率(每秒2800万个多边形),像素填充率达到500Mpixels/s(每秒5亿的像素填充率),而PowerVR SGX 540的标称性能为28MPolys/s的多边形渲染率(每秒2800万个多边形),像素填充率达到1000Mpixels/s(每秒10亿的像素填充率)。三星曾经宣传S5PC110具有每秒9000万个多边形的多边形渲染率,但是这与PowerVR显示芯片设计公司英国IT提供的PowerVR SGX 540的28MPolys/s数据相矛盾,而比PowerVR SGX 540定位更高的PowerVR SGX 545才不过具有35MPolys/s的多边形渲染率,由于采用超频PowerVR SGX 540或增加缓存的方法都不可能获得如此翻天覆地的变化,故而本文中采信PowerVR显示芯片设计公司的说法。

    在Cortex-A8运算核心方面A4与三星S5PC110除了一级缓存外完全相同(64KB),A4的二级缓存(L2 cache) 640 KB,则要稍高于三星S5PC110的L2 cache 512 KB,因而在运算核心的性能方面同频率的A4会稍高于三星S5PC110。三星S5PC110的Cortex-A8运算核心L1 cache 64 KB L2 cache 512 KB的配置实际上也是所有Cortex-A8架构处理器的标准配置,在1GHZ频率下可以达到2000DMIPS的运算能力,DMIPS表示每秒百万条指令集的整数运算能力。

  • 相关阅读:
    CF1375 题解
    CF1381 题解
    CF1394 题解
    CF1383 题解
    git pull提示You are not currently on a branch. Please specify which
    centos6 YUMREPO ERROR ALL MIRROR URLS ARE NOT USING FTP, HTTP[S] OR FILE
    git报错fatal protocol error bad pack header
    Mongo服务器管理之部署MongoDB讨论
    Mongo服务器管理之备份
    Mongo服务器管理之监控MongoDB
  • 原文地址:https://www.cnblogs.com/NL34/p/3592144.html
Copyright © 2020-2023  润新知