AXI总线 - 润新知

AXI总线

AXI总线是一种基于burst的传输总线，适合用在high-bandwidth和low-latency的场景，大致分为5个通道：

                         read address, read data, write address, write data, write response。

支持：

1)unaligned data transfer，包括SIZE的对齐和Wrap Burst的对齐;

2)Burst-based transactions，只有首地址issued;(burst首地址之后的地址，slave来产生)

3)能够进行multiple outstanding address的发送;(outstanding FIFO与reorder FIFO不一样)

4)能够以out-of-order的方式，完成transaction;(应该outstanding的FIFO大于reorder的FIFO depth)

write data channel是一种从master到slave的传输，在一个写操作中，返回一个整体的response。

read data channel是一种从slave到master的传输，在一个读操作中，response与read data同一通道，分别为transfer返回response

AXI中的每个channel包含两个handshake signal，source提供VALID信号，destination提供READY信号。

　　写读分别会有source和destination发出last信号，来表示最后一个transfer。

AXI中的interconnect由一系列的master和slave接口来组成，一般有三种topologies：

shared address and data buses;

shared address buses and multiple data buses;

multilayer with multiple address and data buses;

由于很多系统，对于地址的带宽一般都比数据带宽小很多，所以应用最多的还是shared address buses and multiple data buses。

Interconnect中的Register slices，两个作用：trade-off between cycles of latency and maximum frequency of operaton。

                                                              每个register slice的插入都会增加一个cycle 的latency。

                                                              isolate a longer path to less performance critical。

一个write burst传输：

AW通道在下一个clock cycle被采样，W通道然后传输data，R通道最后传输resp。

没有component可以提前结束一个burst，在resp产生error时，也必须将数据写完(可以加strb，控制写数据)或读完然后将数据丢掉。

　　这种情况在访问FIFO时，会影响之后的数据访问，所以这时，要求master发出准确的transfer。

读写地址中的信号：AXLEN：burst传输的长度，transfer的个数。计算方式AXLEN + 1。

                                      wrap类型的burst只能是2,4,8,16。对于AXI3，incr类型的burst从1-16；对于AXI4，从1-256。

                         　　AXSIZE：每一个transfer中的byte个数。3bit，计算方式2的幂次方，最多128个byte，1024bit。

                              　　如果AXI BUS比AXSIZE大，应该由interface来决定有效的byte lanes。写操作strb信号，读操作无操作。

                       　　AXBURST：表示burst的type。

                              　　 fixed burst：每次的address相同，可以用在loading/emptying FIFO。

                              　　INCR burst：address依次增加，以SIZE的byte数为单位。可以用在正常的sequential memory.

                             　　WRAP burst：最大地址称为wrap boundary，与AXSIZE*AXLEN相对齐。循环读写此区间内的数据。可

                                                     　　　　以进行cache line的访问。length必须是2的幂数。初始地址必须是与size对齐的，到了最大地址之后，会wrap会小的地址。

                      　　AXLOCK：AXI3中包含exclusive transaction和lock transaction，AXI4中只包含exclusive transaction。

                                　　详见之前博客：http://www.cnblogs.com/-9-8/p/4654294.html

                   　　AXCACHE：在AXI3中，4bit数据分别是buffer,cache,read allocate, write allocate。

                                    　　bufferable多用在write操作中，表示可以由一个中间节点来返回response信号。

                                    　　cacheable在读操作中，表示可以prefetch一些数据，在写操作中，表示可以将不同的write merged together。

                                    　　RA针对，读操作。WA针对，写操作。详见之前博客：http://www.cnblogs.com/-9-8/p/4655243.html

                                    　　只有在cacheable有效的情况下，这两个bit才有效。

                                在AXI4中，cache bit改名为modefiable，RA,WA的概念被更新，将不用的哪一个allocate bit改为other allocate。

                     　 AXPROT：3bit数据分别表示，privilage/secure/instruction。在amba总线中与ARM core的状态联系在一起。

                      　AXQOS：AXI4中的信号，4bit的quality，用在每个读写transaction的channel中，用作priority indicator，越大的值，表示越高的

                                　　优先级，默认值是4’b0000表示接口不实现QoS。master侧必须根据scenario来产生具体的QoS值，而slave根据QoS的值

                                 　　来决定不同transaction的值。如用在DDR Controller中，决定transaction的优先级来转换为DDR的读写次序。

               　　　AXREGION：AXI4中的信号，4bit可以表示16个region。主要作用是简化slave中的address decode。由interconnect在做address

                                　　decode时产生。否则使用默认值。同样必须在4k范围内。

                  　　AXUSER：AXI4中的信号，arm不推荐使用。存在于五个通道中。

                  　 RRESP/BRESP：表示四种错误，OKAY/EXOKAY/SLVERR/DECERR。

　　　　　　　　　　　　　 EXOKAY，用在exclusive的访问，

　　　　　　　　　　　　　 SLVERR，表示trans已经经过interconnect，到达slv，但是slv返回error。

　　　　　　　　　　　　　　　　比如，对read-only区域的写，lowe-power状态下的访问，不支持的size，burst等。

　　　　　　　　　　　　　 DECERR，表示interconnect的route出错，被导向interconnect内部的一个default slave。

                                         　　由于axi的out-of-order特性，晚的transfer的resp可能会更早的返回，早的transfer的resp返回的比较晚，master需要可以

                                         　　处理这样的情况的。

读写数据通道：WLAST/RLAST：表示一个transaction中的最后一个transfer。

                    　　WSTRB：只存在于WDATA channel，选取有效的beats。

Lower-power signals：CSYSREQ/CSYSACK：两个与clock controller的handshake signals，来离开和进入lower_power state。

                                                               针对带有power-down/up的peripheral。

                                CACTIVE：表示(不)需要clock，也可以用在没有power-down/up的外设，与clock controller单端通信。

                                三个信号也可以用在一个power domain中。power-down/up的外设需要这三个信号，而没有power-down/up的外设只需要

                                一个信号。

AXI中的reset，reset信号可以在assert时，async，但是在deassert时，必须sync与ACLK。

master必须将AWVALID，ARVALID，WVALID拉低。

slave必须将RVALID，BVALID拉低。

AXI中的handshake signal，所有的通道。

                     source不允许等READY信号来触发VALID信号，而且一旦VALID信号触发就必须等到READY信号有效。

　　　　　　　　ready信号可以在valid信号无效时，有toggle的变动。

                     destination允许等到VALID信号有效，而触发READY。

一般的READY信号，有两种产生方式：1)等VALID有效后，READY信号有效。2)default READY信号有有效。

ARM官方的建议，AWREADY/WREADY/BREADY/ARREADY/RREADY都default为1，这样可以让传输更快的传输，但是slave端必须准备好。

在read data channel中，RVALID必须等到ARVALID和ARREADY信号都assert，RVALID才能assert。

　　R通道必须在AR通道完成之后，才开始。

在write data channel中，BVALID必须等到WVALID和WREADY信号都assert，BVALID才能assert(AXI3)。

　　b通道必须在aw通道完成之后，才开始，但是在axi3中aw和w通道之间的关系，是没有约束的。

                                   AWREADY的assert可以等到AWVALID和WVALID信号有效后。WVALID的assert不可以等到AWREADY信号有效。

在write data channel中，BVALID必须等到AWVALID和AWREADY，WVALID和WREADY信号都assert，BVALID才能assert(AXI4)。

　　　　主要是因为AXI4中取消了wid，w通道的顺序与aw通道的顺序是相同的。

在AXI3中，由于AW通道和w通道完全没有关联，所以aw和w的传输顺序是任意的，aw可以在w之后，aw也可以与w同一拍。

　　但是AXi4中，由于wid的取消，w通道只能紧接着aw通道，就不存在data ahead of address的传输。

　　(在axi3中，只要aw通道插入的RS比w通道多一些，就可能出现data ahead of address)

AXI中的slave可以归结为两大类：Memory slave，一般要求handle all transaction type。

                                            　　 Peripheral slave，只要求work for a defined method of access。

Transaction identifiers：一般来说interconnect都会在ARID，AWID，WID(AXI4已删除)中增减一些addition bits。

                         interconnect在送来的transaction中增加addition bits(AWID/WID/ARID)来表示各个master port。因为各个master port可能会有ID冲突。

                         interconnect在slave发送过来的transaction中减少addition bits(RID/BID)，来发送给master。

                                  这样，slave中的ID号总是比master中的ID号，多几位。

                         对于只支持single order的interface，可以将ID的output，tie掉。

AXI中的order model：同一ID的transaction必须是ordered，不同的ID的transaction order no restrict。

                                同一ID，slave端必须按接收到的address顺序来传输。

                                outstanding address是指：master可以不等该transaction结束，就发送下一个transaction的address。

                                complete transaction out of order是指：transaction之间的完成顺序与issue的order可以不同。

                                但是同一个burst中的transfer必须是按顺序的。

                                对于ARID，同一个master返回的同一个ID的transaction必须是按address的顺序来发送的。

                                                在interconnect中，同一ID的transaction必须按master issue address的order来返回。

                                对于AWID和ARID，协议中没有限制，如果master要求必须是先读后写，master端必须保证。

                                简单的master可以选择，transaction按顺序来处理，一次一个transaction，不支持outstanding。



                                read data reordering depth与slave中可以pending的address的个数相同。(也叫interleave depth)

                                                               按顺序处理transaction的slave，等于read data reordering depth为1。

                                Writing data ordering：如果slave不支持interleave的write，master在发送write data的时候，与address的顺序必须是一致的。

                                                                 同样interconnect在处理的过程中，也必须保证data的顺序与address的顺序也是一致的。(与WID号无关)

                                                                 interleave的操作只能用在不同ID号的burst中。

                                                                 interleave depth与slave中支持的pending address个数相同。

AXI中的interleave操作是指burst之间是有交叠的，interleave的深度，表示可以交叠的个数。

　　但是这个特性，会很大程度的增加IP的设计复杂度，(自己设计的master一般不会有这个feature，但是arm本身的core是可能有的，

                                   一般情况下，对大多数的master，interleave write不是很必要，所以master可以以address的order来发送data，

                                   只有当master从不同的多个source，像interconnect写数据时，才需要进行interleave操作。

                             读写之间的interaction：协议中没有规定读写之间的关系，所以必须由master保证一个结束之后，才发送下一个。

                             对于peripheral device，master保证transaction必须按他们issued order来到达peripheral。一个接一个，不进行outstanding。

                             对于memory device，master，需要有addr check保证如果有same/overlapping address，

                                                                               transaction也必须一个个发送，不能outstanding。

对于unaligned transfer，master可以提供一个lower-address，unaligned address，通过byte lanes strobes信号来signal unaligned address。

　　或者也可以传输aligned transfer。

　　先传输低地址的非burst transfer，后按aligning的burst传输：(白色表示传输数据的地址)，此时unaligned addr会占用一个transfer/beat。

　　

对于narrow transfers，每个beat的byte lanes是不同的，针对burst，每次增加的地址，由size计算得到。

　　

　　例如一个burst length=4的read，起始地址为xx111，arsize=64bit，bus中的width=128bit.

　　　　则首先master发出一个起始地址为7的，transfer，此时从slave拿到的数来自[63:56]；

　　　　　　 master发出下一个起始地址为0的，transfer，此时从slave拿到的数来自[31:0]；

　　　　　　   master发出下一个起始地址为8的，transfer，此时从slave拿到的数来自[63:32]；

　　　　　　　 master发出下一个起始地址为0的，transfer，此时从slave拿到的数来自[31:0]；

　　　　至此四个length的burst传输结束。

axi中的数据，是不区分大小端的，直接将memory中的低位数据，放在data bus的低位。byte-invariant

　　实际数据的大小端，需要由slave来自己调整。



对于一个burst传输，不能超过4K的地址空间，主要是为了防止burst横跨两个slave。

　　通过burst，横穿两个IP，会导致第二个IP的地址出错，从而数据出错，所以必须有这样的限制机制。

因为memory page size的一般就是4K，所以这里设置为4K Byte。

AXI4中取消了W通道的id号信号，w通道的次序保证与aw通道的次序相同。

关于bufferable和cacheable：cacheable表示可不可以直接去cache中寻找数据以及cache miss之后的操作，如allocated等。

                                        　　bufferable主要考虑write操作中，response返回的执行者是不是最终的slave发出的。

关于valid和ready信号，数据输出者，发出valid信号，数据接收者，发出ready信号。

eg:arm读数据，rvalid由matrix提供，ready由arm core提供。

AXI中的5组信号，可以是master---interconnect，可以是interconnect----slave，也可以是master-slave。
相关阅读:
POJ 1797 Heavy Transportation
POJ 2253 Frogger
POJ 2387 Til the Cows Come Home
HDU 1233 还是畅通工程
 POJ 1287 Networking
标准C程序设计七---63
标准C程序设计七---62
标准C程序设计七---61
标准C程序设计七---60
标准C程序设计七---57
原文地址：https://www.cnblogs.com/-9-8/p/4728379.html