• 痞子衡嵌入式:实测i.MXRT1010上的普通GPIO与高速GPIO极限翻转频率



      大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家介绍的是i.MXRT1010上的普通GPIO与高速GPIO极限翻转频率

      上一篇文章 《聊聊i.MXRT1xxx上的普通GPIO与高速GPIO差异及其用法》,痞子衡从原理上介绍了 i.MXRT1xxx 系列里普通 GPIO 和 HSGPIO 差异,今天我们就来实测它们的极限翻转频率,看看它们实际表现差别到底有多大。本次选择的测试芯片是 i.MXRT1010,这颗芯片从功能上来说是目前 i.MXRT1xxx 系列里的小兄弟,但别小看它,因为是后面推出的型号,恩智浦的设计团队为它在某些方面做了特殊的性能优化,包括 HSGPIO 性能。话不多说,开测:

    一、测试准备工作

    1.1 测试板卡及测试点

      选定的板卡是恩智浦官方 MIMXRT1010-EVK,板卡上连接 LED 灯的是 GPIO_11,翻看芯片参考手册,这个 PAD 既可以配到普通 GPIO(GPIO1[11]) 也可以配到 HSGPIO(GPIO2[11]),正是理想的 PAD,我们就选择这个 PAD 做测试。此外,最终 I/O 输出波形形态跟外围驱动电路也有关联,所以这里也有必要交待清楚:

    • Note: 所用示波器型号是 Tektronix MDO3024, 带宽 200MHz, 采样率 2.5GS/s

    1.2 I/O 翻转测试代码

      测试工程我们可以直接在 \SDK_2.11.0_EVK-MIMXRT1010\boards\evkmimxrt1010\driver_examples\gpio\led_output 例程上修改,为了尽力展示 GPIO 极限性能,不受其他瓶颈因素干扰,这里选择代码执行性能最高的工程 build(即代码段在 ITCM 里,数据段在 DTCM 里)。

      I/O 初始化代码很简单,在 《普通GPIO与高速GPIO差异及其用法》 文章里都介绍清楚了。这里仅有一点注意,为了统一最终 I/O 输出效果,不管是用于普通 GPIO 还是 HSGPIO,我们都直接将测试 PAD 配置到最快的 200MHz 运行频率(PAD 支持的 50/100/150/200MHz 运行频率配置不同主要是对信号幅值响应表现有影响,不过痞子衡实测这四种速度配置对于 100MHz 的 I/O 翻转信号输出效果是一样的(仅示波器端观测波形角度而言),看到的都是标准幅度的正弦波):

    void io_test_init(bool useNormalGpio)
    {
        gpio_pin_config_t led_config = {kGPIO_DigitalOutput, 0, kGPIO_NoIntmode};
        CLOCK_EnableClock(kCLOCK_Iomuxc);      
        IOMUXC_SetPinMux(IOMUXC_GPIO_11_GPIOMUX_IO11, 0U); 
        // Fast Slew Rate, R0/7, 200MHz
        IOMUXC_SetPinConfig(IOMUXC_GPIO_11_GPIOMUX_IO11, 0x70F9U);
        if (useNormalGpio)
        {
            // GPIO1
            IOMUXC_GPR->GPR26 &= ~(1u << 11);
            GPIO_PinInit(GPIO1, 11, &led_config);
        }
        else
        {
            // GPIO2
            IOMUXC_GPR->GPR26 |= (1u << 11);
            GPIO_PinInit(GPIO2, 11, &led_config);
        }
    }
    

      在 GPIO 模块里跟电平输出控制相关的寄存器有两个,一个是 DR 寄存器,另一个是 DR_TOGGLE 寄存器,都可用于实现输出电平翻转。有如下代码所示的三种常见电平翻转方法,在低翻转频率情况下,这三种方法是等效的,但是在极限翻转频率情况下,这三种方法表现不完全一致,下一节实测结果会告诉你:

    void io_test_run(void)
    {
        io_test_init(false);
        while (1)
        {
            // 电平翻转方法一:异或位操作
            //GPIO2->DR ^= 0x800;
    
            // 电平翻转方法二:直接赋值切换位
            //GPIO2->DR = 0x800;
            //GPIO2->DR = 0x000;
    
            // 电平翻转方法三:利用 TOGGLE 位
            GPIO2->DR_TOGGLE = 0x800;
        }
    }
    

    1.3 芯片系统时钟配置

      《普通GPIO与高速GPIO差异及其用法》 一文里讲了,普通 GPIO 时钟源是 IPG Bus,而 HSGPIO 时钟源是 AHB Bus,因此测试工程里 AHB/IPG 时钟配置会影响最终 I/O 翻转极限频率。下图是 i.MXRT1010 内核结构里的 HSGPIO 通路,它和 i.MXRT1060/1170 内核结构里 HSGPIO 通路其实有点小区别,这也是 i.MXRT1010 上的优化之处。

      led_output 例程里的默认系统时钟配置,AHB/Core 时钟来自于 PLL6 - 500MHz,AHB_PODF 设 0 (即不分频),而 IPG Bus 时钟源固定来自于 AHB/Core,且只能在其基础上做 1/2/3/4 分频,我们知道 IPG Bus 最高仅支持 150MHz,因此在这种情况下 IPG_PODF 只能设 3(四分频),IPG 时钟实际是 125MHz,显然 HSGPIO 访问可以得到最优性能,但普通 GPIO 达不到最优性能。

    PLL6, CCM_ANALOG->PLL_ENET[ENET_500M_REF_EN] = 1'b1,固定 500MHz
    CCM->CBCMR[PRE_PERIPH_CLK_SEL] = 2'b11,derive clock from PLL6
    CCM->CBCDR[PERIPH_CLK_SEL] = 1'b0,derive clock selected by CCM->CBCMR[PRE_PERIPH_CLK_SEL]
    CCM->CBCDR[AHB_PODF] = 3'b000,divide by 1
    CCM->CBCDR[IPG_PODF] = 2'b11,divide by 4
    

      为了测试普通 GPIO 的最优性能,我们需要同时再测试一种新的系统时钟配置,AHB/Core 时钟源选用 PLL2_PFD3,将这个源配置为 452.6 MHz,AHB_PODF 依旧设 0,这样 IPG_PODF 设 2(三分频)可以得到 150.8MHz 的 IPG 时钟,这时普通 GPIO 访问可以得到最优性能,不过 HSGPIO 访问就要损失点性能了。

    PLL2,CCM_ANALOG->PFD_528[PFD3_FRAC] = 21,即 528MHz*18/PFD3_FRAC = 452.57MHz
    CCM->CBCMR[PRE_PERIPH_CLK_SEL] = 2'b10,derive clock from PLL2 PFD3
    CCM->CBCDR[PERIPH_CLK_SEL] = 1'b0,derive clock selected by CCM->CBCMR[PRE_PERIPH_CLK_SEL]
    CCM->CBCDR[AHB_PODF] = 3'b000,divide by 1
    CCM->CBCDR[IPG_PODF] = 2'b10,divide by 3
    

    二、测试波形结果

      准备工作都做完了,现在就是示波器连上板卡开始实测了,根据组合,一共有时钟配置(x2)* I/O 类型(x2)* 翻转方法(x3)总计 12 个结果,这里仅贴出 HSGPIO 在 500MHz AHB/Core 时钟频率下的三种翻转方法所得到的波形结果,全部测试结果见最后一节。

      首先是 GPIO->DR 寄存器异或位操作得到的波形结果,为了减少 while(1) 的执行对翻转频率的影响(毕竟这一句 B.N 跳转指令也是要消耗 CPU 周期的),我们在 while(1) 里加十次翻转代码,统计结果时取 5/10 个波形周期求平均,最终得到翻转频率为 22.946 MHz,效果似乎一般。汇编窗口来看,这句 C 代码异或操作被翻译成了三条指令,先 LDR 指令读出 GPIO->DR 寄存器当前值,然后 EOR 指令做异或操作,最后再 STR 指令写入 GPIO->DR 寄存器,应该是 LDR 回读指令耗时较长。

      再来看 GPIO->DR_TOGGLE 置位操作和 GPIO->DR 的直接写入操作结果,实测下来发现这两种方法得到的翻转频率是一样的(从汇编窗口来看两种翻转方法都是仅一条 STR 指令搞定),都是 250MHz,效果虽好,但有点过头,因为波形里看到的不是标准幅值 3.3V 的方波(暂不确定是不是 200MHz 带宽的示波器瓶颈),而是减半幅值(约 1.6V )的正弦波,也不排除 PAD 最大运行速度是 200MHz,它只能保证在低于 200MHz 的情况下有很好的电压幅值响应表现(包括翻转斜率),超过这个频率,波形频率值不受影响,但电压幅值响应表现不能保证。

      为了验证是不是示波器瓶颈,痞子衡找了台更高性能的 Tektronix MSO5204(带宽 2GHz, 采样率 10GS/s),复测了一下这个 250MHz 的信号,得到结果略有改善,但幅度一样有衰减(2.34V),还是 PAD 本身限制。

    三、完整结果统计

      现在我们来看一下全部的结果,因为三种 I/O 翻转方法里有两种效果是一样的,所以我们省略了 GPIO->DR 直接写入这种方法的结果,最终得到了 8 个结果。根据实测结果,我们得到了如下结论:

    • 总结1: PAD配置里的运行频率并不限制最终输出翻转频率,只是无法保证超过设置频率后的波形幅值响应表现(包括翻转斜率)
    • 总结2: 置位 GPIO->DR_TOGGLE 寄存器可获得最佳 I/O 翻转性能
    • 总结3: 普通 GPIO 翻转频率约是时钟源 IPG Bus 的 1/7.5,极限翻转频率是 20.614MHz
    • 总结4: HSGPIO 翻转频率约是时钟源 AHB Bus 的 1/2,极限翻转频率是 250MHz
    AHB/Core时钟频率 IPG总线时钟频率 I/O PAD配置 I/O翻转方法 普通GPIO极限翻转频率 高速GPIO极限翻转频率
    500MHz 125MHz Fast Slew, 200MHz 异或GPIO->DR 5.214MHz
    标准幅度方波
    22.946MHz
    标准幅度方波
    500MHz 125MHz Fast Slew, 200MHz 置位GPIO->DR_TOGGLE 15.533MHz
    标准幅度方波
    250MHz
    减半幅度正弦波
    452.6MHz 150.8MHz Fast Slew, 200MHz 异或GPIO->DR 6.309MHz
    标准幅度方波
    18.864MHz
    标准幅度方波
    452.6MHz 150.8MHz Fast Slew, 200MHz 置位GPIO->DR_TOGGLE 20.614MHz
    标准幅度方波
    226.244MHz
    减半幅度正弦波

    四、一个有趣的问题

      最后再留一个开放问题,在痞子衡旧文 《以GPIO模块为例谈谈中断处理函数(IRQHandler)的标准流程》 里提到过 ARM Errata 838869 ,即在 Cortex-M4/7 上,如果 CPU 执行速度远远高于 GPIO 外设寄存器写入速度,如果代码逻辑里涉及 GPIO 寄存器回读,一般需要在 GPIO 寄存器写入操作后额外插入 DSB 指令来保证同步。

      我们现在在 500MHz AHB/Core 时钟频率下 HSGPIO 翻转代码里额外插入 DSB 指令,看看有什么影响,结果翻转频率从 250MHz 一下子降到了 35.8MHz。

      至此,i.MXRT1010上的普通GPIO与高速GPIO极限翻转频率痞子衡便介绍完毕了,掌声在哪里~~~

    欢迎订阅

    文章会同时发布到我的 博客园主页CSDN主页知乎主页微信公众号 平台上。

    微信搜索"痞子衡嵌入式"或者扫描下面二维码,就可以在手机上第一时间看了哦。

      最后欢迎关注痞子衡个人微信公众号【痞子衡嵌入式】,一个专注嵌入式技术的公众号,跟着痞子衡一起玩转嵌入式。

    痞子衡嵌入式-微信二维码 痞子衡嵌入式-微信收款二维码 痞子衡嵌入式-支付宝收款二维码

      衡杰(痞子衡),目前就职于恩智浦MCU系统部门,担任嵌入式系统应用工程师。

      专栏内所有文章的转载请注明出处:http://www.cnblogs.com/henjay724/

      与痞子衡进一步交流或咨询业务合作请发邮件至 hengjie1989@foxmail.com

      可以关注痞子衡的Github主页 https://github.com/JayHeng,有很多好玩的嵌入式项目。

      关于专栏文章有任何疑问请直接在博客下面留言,痞子衡会及时回复免费(划重点)答疑。

      痞子衡邮箱已被私信挤爆,技术问题不推荐私信,坚持私信请先扫码付款(5元起步)再发。


  • 相关阅读:
    Java学习086Springboot 自定义启动 banner 信息
    Java学习085Springboot 解决 InetAddress.getLocalHost().getHostName() took 13387 milliseconds to respond. Please verify your network configuration
    PySe023pandas.read_csv 读取 csv 文件,指定列数据类型 解决字符串数据列变为数字的问题
    Linux027Centos JDK 环境离线安装配置
    Java学习087自定义MANIFEST.MF 文件并打包生效
    如何在跨平台的环境中创建可以跨平台的后台服务,它就是 Worker Service。
    如何为Windows服务增加Log4net和EventLog的日志功能。
    微服务与SOA的区别
    java:对象的内存解析
    快速学习一个新技术的方法
  • 原文地址:https://www.cnblogs.com/henjay724/p/15542520.html
Copyright © 2020-2023  润新知