• Python:通过执行100万次打印来比较C和python的性能,以及用C和python结合来解决性能问题的方法 .


     python作为动态语言,开发效率相当高,但如我们所知,动态语言的执行效率往往是比较低的,请看下面简单的测试过程:

     一、 C语言实现100万次打印:

      代码:

    1. #include<stdio.h>   
    2. #include <time.h>   
    3.   
    4. int main(int argc, char* argv[])  
    5. {  
    6.     unsigned long i = 1;  
    7.     unsigned long ulNum = 1000000;  
    8.   
    9.     clock_t start, finish;  
    10.     double  duration;  
    11.   
    12.     start = clock();  
    13.   
    14.     while (ulNum != 0)  
    15.     {  
    16.         printf("\nThe ulNum is: %u ", i);  
    17.         ulNum--;  
    18.         i++;  
    19.     }  
    20.   
    21.     finish = clock();  
    22.     duration = (double)(finish - start) / CLOCKS_PER_SEC;  
    23.     printf( "\n Use Time: %f seconds\n", duration );  
    24.   
    25.     system("pause");  
    26.   
    27.     return 0;  
    28. }  

    测试:

    可看出,执行了约489秒。

    二、python实现100万次打印:

    代码:

    1. #!/usr/bin/env python   
    2. # -*- coding: utf-8 -*-   
    3.   
    4. import time  
    5. import os  
    6.   
    7. time_begin = time.clock()  
    8.   
    9. i = 1  
    10. ulNum = 1000000  
    11. while (ulNum != 0):  
    12.     print "The ulNum is: %u " % i  
    13.     ulNum -= 1   
    14.     i += 1    
    15. print "Use time: %s" % (time.clock() - time_begin)   
    16. os.system("pause")  


    测试:

    可看出,执行了约675秒。

    三、性能问题解决方法:

      通过上面的比较,可以看出,同样一个算法,C和python执行所需要的时间相差180多秒,所以我们需要一个解决方法,使编程既有python般的开发效率,又有C般的执行效率,所以我们想到如果将python程序中消耗性能最大的语句用C来实现,将会比较好地解决此问题,当然,实现方法可能有多种,本文仅通过python调用dll的方法来实现,其他方法后续再分析。

    思路如下:

     1、将程序中循环部分用C实现,并封装为一个dll;

     2、在python中调用此dll来计算;

     方案实现:

     1、制作dll,使用VC可以很方便的制作一个dll出来,代码如下,编译一下就会生成一个test_dll.dll文件,注意编译成Release版本。

    1. // test_dll.cpp : Defines the entry point for the DLL application.   
    2. //   
    3.   
    4. #include "stdafx.h"   
    5. #include <stdio.h>   
    6.   
    7.   
    8. BOOL APIENTRY DllMain( HANDLE hModule,   
    9.                        DWORD  ul_reason_for_call,   
    10.                        LPVOID lpReserved  
    11.                      )  
    12. {  
    13.     return TRUE;  
    14. }  
    15.   
    16.   
    17. extern "C" _declspec(dllexportvoid print_sum(unsigned long ulNum)   
    18. {   
    19.     unsigned long i = 1;  
    20.   
    21.     while (ulNum != 0)  
    22.     {  
    23.         printf("\nThe ulNum is: %u ", i);  
    24.         ulNum--;  
    25.         i++;  
    26.     }  
    27.   
    28. }  


    2、使用python调用test_dll.dll文件,代码如下:

    1. import os  
    2. import ctypes  
    3. import time  
    4.   
    5.   
    6. time_begin = time.clock()  
    7.   
    8. test_dll = ctypes.cdll.LoadLibrary('test_dll.dll')  
    9.   
    10. test_dll.print_sum(1000000)  
    11.   
    12. print "Use time: %s" % (time.clock() - time_begin)   
    13.   
    14. os.system("pause")  


    3、测试一下这次的执行时间:

     这次我们用了507秒,可以看出和C程序运行结果的差不多。

    四、后记

      通过pyhton调用dll文件仅是提高性能的一个办法,如C和python混合编程等方法均可实现此目的,具体请见后续博文。

  • 相关阅读:
    关于范型
    c#.net实体类序列化方法  为什么要序列化
    游标示例
    干掉switch语句
    java面向对象总结(一)
    Java泛型简明教程(转)
    java 成员变量、局部变量、静态变量
    Java 集合类图(转)
    java泛型(擦除)
    java垃圾回收
  • 原文地址:https://www.cnblogs.com/lhj588/p/2446267.html
Copyright © 2020-2023  润新知