• CUDA npp运动检测模块性能测试


    测试环境:

    Cpu:       Intel(R)Core(TM)i7-4790 CPU @3.6GHZ

    GPU:        NVIDIA GeForce GTX960 *2  

    操作系统:   Windows 7 专业版 64位操作系统

    内存:        安装内存(RAM)      16.0GB

    显存:        4g*2

           测试指标

       测试项目

    单帧耗mean500P

     GPU占用率

    显存占用

    UnitM

    Cpu占用率

    内存占用

    UnitM

    1080p

    1 路

    9.23ms

     98% / 0%

     237 / 0

    0%

    263

    1080p

    2 路

     9.05ms

    98% / 98%

     237 / 237

    0-1%

    528

    1080p

    4 路

     18ms

    99% / 99%

     389 / 389

    0-1%

    528

    1080p

    8 路

     35.5ms

     99% / 99%

     702 / 702

    0-1%

    529

    1080p

    16路

     72.5ms

    99% / 99%

     1325 / 1325

    0-1%

    520

    1080p

    24路

    109.5ms

    99% / 99%

     2339 /2339

    0-1%

    522

    720p

    1 路

    4.27ms

    96% / 0%

     153/0

    0%

    263

    720p

    2 路

     4.2ms

     96% / 96%

    153/153

    0%

    528

    720p

    4 路

     8ms

     99%/99%

     225/225

    0-1%

    515

    720p

    8 路

     16ms

    99%/99%

     370/370

    0-1%

    519

    720p

    16路

     32ms

    99%/99%

     661/661

    0-1%

    520

    720p

    32路

     65ms

    99%/99%

     1243/1243

    0-1%

    523

    4cif

    1 路

    2.1ms

     90%-90%

    121 / 0

    0-1%

    341

    4cif

    2 路

    2ms

     91% / 91%

     121 / 121

    0-1%

    518

    4cif

    4 路

    3.5ms

     99% / 99%

     162 / 162

    0-1%

    519

    4cif

    8 路

    7ms

     99% / 99%

     244 / 244

    0-1%

    519

    4cif

    16路

    14ms

     99% / 99%

     408 / 408

    0-1%

    521

    4cif

    32路

    28.5ms

     96% / 96%

     737 / 737

    0-1%

    524

    4cif

    64路

    102ms

    55% / 55%

     1394 / 1394

    0-1%

    529

       注: 1. 上述测试的每一路对应主机程序的一个线程。

             2. 上述的所有测试不考虑主机和内存之间的数据拷贝,单纯的测试GPU的计算能力

                所以cpu基本处于空闲状态。

        分析:1. 随着主机线程数目的增多,线程之间的调度时间延时会导致GPU占用率下降

                 2. 比较此前测试的GTX760显卡, GTX960的计算能力略弱,但多线程能力稍强。

  • 相关阅读:
    热修复之类加载机制总结
    socket之tcp如何维护长连接
    sqlite之多线程处理
    android主线程ActivityThread-转载
    线程之ThreadLocal使用
    图片之压缩总结
    线程之交替执行的实例
    git的最常用命令总结
    sqlite之常见的语句
    activity之分析-3分钟看懂Activity启动流程
  • 原文地址:https://www.cnblogs.com/Jnshushi99/p/4711201.html
Copyright © 2020-2023  润新知