• 【心得】Lattice后端使用经验小结(ECP5UM,DDR3,Diamond3.10,Reveal逻辑分析)


    【博客导航】 【导航】FPGA相关

    背景

    下边的内容,适合初次使用Lattice的、具备FPGA开发经验的同学。

    1、初次使用,还真遇到不少的坑,Lattice的工具也有不少优缺点,通过总结,希望能缩短熟悉的时间。

    2、具体问题,欢迎留言交流。

    DDR3 IP例化

    LEF5UM器件,应用DDR3控制器IP。主要分几步:IP获取,安装,例化。

    1、先在impl1目录下,右键,新建sbx文件,即Clarity Designer,通过该文件,进行IP的例化管理。

    2、打开sbx,在选项卡“Lattice IP Server”里点击IP联网获取IP列表。

    3、选择“DDR3 SDRAM Controller”,目前(18年12月)最新版本3.1,下载(格式exe)后安装到指定目录(如:C:LatticeCoreddr3_sdram_common_v3.1),这样可以在选项卡“Lattice IP”中看到“ddr3 sdram controller 3.1”。

    4、打开ip,GUI界面如下,在本项目中,参考时钟(RefClock)来自单板晶振产生的100M,ddr的工作频率400M,双沿也就800M。Memory Type选择On-board Memroy,总线宽度16,配置x16,时钟宽度1。Data_rdy to Write Data Delay选择2,表示data_rdy有效之后必须在第2拍送数据。

    注意:这里涉及时序收敛上的编码技巧。通常,用户逻辑数据先存入fifo,再送给ddr3控制器,再加上控制器要求2拍给数据,这样,fifo跟ddr3控制器之间时序就比较难收敛(如果很好收敛,那说明你在设计上已经关注到了这点),我的办法很简单,就是对fifo进行预读操作,在读使能送出之前,先预读3拍出来,等ddr发出读使能时,数据就不是从fifo到DDR3了,而是在这之间插入了几拍的寄存器,从而缓解了时序压力。

    DDR3仿真

    仿真脚本我会单独介绍,其实IP工程给出了仿真脚本,借用过来修改修改就可以使用。这里只提一个导致仿真只运行60多us就提前终止的小问题。

    解决办法,请仔细阅读仿真工具的告警,工具明确说了,是Memory overflow,建议增加MEM_BITS参数或者定义MAX_MEM。绿色文字也给出了文件路径的指示,在ddr3_ddr3_x16.v中,include有参数文件

    ddr3_parameters.vh,就是同一目录下,打开vh文件,搜索MEM_BITS,默认为10,修改为16即可。

    小结:遇到问题先不慌张,认真阅读工具给出的提示信息,通常会有解决思路。有同学说英文不好咋办,那就复制粘贴到网上的翻译软件呗,不然还能凉拌?

    bit/mcs烧录

    Lattice工具一个不好用的地方,就是mcs烧录得讲究顺序,否则会报错。烧录mcs的步骤: 

    A、JTAG模式下,选择Erase Only。

    B、选择SPI Flash,操作时可以不用verify,如下。

    Reveal逻辑分析仪

    FPGA厂家都会提供内嵌逻辑分析仪,Xilinx叫chipscope,Lattice的叫reveal,可以单独安装reveal程序,也可以在diamond工程中打开。在“File List”的“Debug Files”里,右键,点击Reveal Project Files,可新建*.rvl文件,相对Xilinx,这个rvl比较好用,复制veriog代码信号名,只要没被优化,就可以很快找到。

    添加信号时,除了在trace signal setup里选择时钟和观察信号之外,另外还需要在trigger signal里设置,这点比Xilinx稍微麻烦点。 

    trigger设置也有套路。第一步,在trigger unit中拉入信号,可以在一个条件里,也可以分开,operator可以不用管,到时抓波形时可以修改的。第二步,在trigger exprssion里,直接把unit的name复制下来就好。

    以上操作完毕,记得点击design rule check(下图靠上的图标),检查是否有错,然后点击insert debug,让逻辑分析的时钟自动添加到后端约束lpf文件里(在约束的首行)。

    抓波形的其他技巧

    • 若要保留抓波形的相关文件,需要复制*.bit,*.rvl和*.rvs文件,同时,对*.rvs文件内容的第一行进行修改,确保指向确定的文件。
    • 出于测试目的,临时添加的信号,为防止被优化掉,可使用 reg signal_name/* synthesis syn_keep=1 */; 直接让信号保留,记住,完成综合之后,要手工点击design fresh,这样才能在rvl文件中查找到该添加的测试信号。

    后端约束lpf

    不正确的约束,或者遗漏的约束,会导致跑的结果不符合预期。约束时,记得下边几个方面不要遗漏。

    1、位置约束,这个和具体硬件相关,对照硬件PCB文件找到相应管脚即可,并添加IO的电平属性,也可通过ALLPORTS设置默认的电平。

    1 LOCATE COMP "DDR_CLK_I" SITE "AD1" ;
    2 IOBUF ALLPORTS IO_TYPE=LVCMOS33 ;
    3 IOBUF PORT "CLK_27M_I" IO_TYPE=LVCMOS33 ;

    2、时钟约束,在【tool--netlist view】下边,点net图标,点开clock可看到整个项目里的时钟信号,然后逐一确认时钟频率并添加约束。

    1 FREQUENCY NET "ddr_arbiter_inst/ddr_core_inst/U1_clocking/clk_in_c" 100.0    MHz PAR_ADJ 5.0 ;
    2 FREQUENCY NET "user_clk" 200.0 MHz PAR_ADJ 40.0 ;
    3 FREQUENCY NET "*/U1_clocking/clkop" 400.0 MHz PAR_ADJ 80.0 ;

    3、DDR约束,直接参考IP例子ddr3_x16_eval.lpf抄过来就好(最多确认下那些信号是否都有效),通常在下边目录:xxxcoregen_hwt_bit_v901_nocdr_noddrddr3_x16ddr_p_evalddr3_x16impllse

    4、不需要时序分析的路径。Xilinx的约束是TIG,Lattice就是BLOCK,免得后端工具把时间耗费在这些不需要时序分析的路径上。

    1 BLOCK PATH FROM CLKNET "clk_54m_pll" TO CLKNET "clk_148m5" ;
    2 BLOCK NET    "video_rddr_scaler_inst/fifo_rst" ;

    5、接口信号的上下拉设置,通常设置为NONE,对按键、IIC则设置为上拉PULLMODE=UP。

    后端报告

    后端跑完,关注的信息,包括:

    • 运行时间,决定了迭代的周期多久,方便评估验证的效率。虽然报告没给出时间耗费,但有起始时间(下图synplify报告最前边几行)和最终产生bit的时间(看bit修改日期就知道),首尾做个减法就得到最终结果。

    • 时序报告,score不能太高,具体得分需要逐条分析,从而评估bit的质量,或者是否适当提高时序约束频率,面积约束等策略。通过netlist的查看,检查时钟路径是否都覆盖,避免每次跑出版本的功能不具备一致性。
    • 资源报告,评估后端风险,各个模块资源等

    后记

    先暂时列这些,想起了再补充。 

    =======================

    by NicoWei
    2019-3-8 23:00:48

    =======================

  • 相关阅读:
    04-老马jQuery教程-DOM节点操作及位置和大小
    03-老马jQuery教程-DOM操作
    02-老马jQuery教程-jQuery事件处理
    01-老马jQuery教程-jQuery入口函数及选择器
    08Vue.js快速入门-Vue综合实战项目
    09Vue.js快速入门-Vue入门之Vuex实战
    07Vue.js快速入门-Vue路由详解
    06Vue.js快速入门-Vue组件化开发
    整套高质量前端基础到高级视频教程免费发布
    05-Vue入门系列之Vue实例详解与生命周期
  • 原文地址:https://www.cnblogs.com/free123/p/10175506.html
Copyright © 2020-2023  润新知