免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 8785 | 回复: 11
打印 上一主题 下一主题

[有趣的Python 8] 使用C模块来提高性能 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-06-15 16:02 |只看该作者 |倒序浏览
Python毕竟是解释型的语言,在复杂算法上的速度还是比C要差一点。另外大量的C的Library的重用也是一个很重要的话题。好在Python可以很容易的使用C编写的module来提高关键路径的性能和复用已有的C的Library。

OK,我们先来写个大整数乘法来看一下Python的性能。我对性能方面不是高手,这个例子不一定恰当。全当是个小实验。另外重点还是放在如何使用C编写的模块上。为了突出重点,就假设我们有C的Library的source code,或者C的module就是为了Python程序开发的。好,开始。先写个Python的实现。


  1. #! /usr/bin/python

  2. #main.py

  3. import time
  4. import timeP
  5. import timeC

  6. t1 = time.time()
  7. timeP.time()
  8. t2 = time.time()
  9. timeC.time()
  10. t3 = time.time()

  11. print "Python module time: %f seconds" % (t2 - t1)
  12. print "C module time: %f seconds" % (t3 - t2)
复制代码

timeP是用Python写的Module,而timeC就是用C写的了。计算的内容都是一样的。

  1. #! /usr/bin/python

  2. #timeP.py

  3. def time():
  4.     for i in range(0,100000):
  5.         x = 123498
  6.         y = 98082432
  7.         z = x * y
复制代码

在看C的module之前。我们要先学习几个基础知识。首先,每一个module都要告诉Python Interpreter到底这个模块有几个函数。这个是由"initMODULE_NAME"函数来实现的,其实就是把一个List作为参数传给Python/C API里的一个特殊函数做到的。
另外为了交换数据,c的module里的函数要以PyObject*作为返回类型,即使是不需要返回值的,也要返回Py_None,就是Python里的None啦。俺就是一开始没有注意,结果一直segmentation fault。

最后,一定要include Python.h(废话)

  1. #include <Python.h>;
  2. #include "time_test.h"

  3. ///timeC.c
  4. /// the wrapper for time_test.c
  5. static PyObject* timeC_time()
  6. {
  7.     time_test();
  8.     return Py_None;
  9. }

  10. static PyMethodDef timeCMethods[] = {
  11.     {"time",  timeC_time, METH_VARARGS,
  12.         "Execute a shell command."},
  13.     {NULL, NULL, 0, NULL}        /* Sentinel, end of list of functions*/
  14. };


  15. PyMODINIT_FUNC inittimeC()
  16. {
  17.         Py_InitModule("timeC", timeCMethods);
  18. }
复制代码

这个module其实是一个C的Library(库的例子,没有这么mini的库啦,呵呵)的wrapper。我顺便把C的Library的code也贴在这里:

  1. #ifndef _TIME_TEST_H
  2. #define _TIME_TEST_H

  3. extern void time_test();

  4. #endif
复制代码


  1. #include "time_test.h"

  2. ///time_test.c
  3. void time_test()
  4. {
  5.     int x = 123498;
  6.     int y = 98082432;
  7.     int z = 0;
  8.     int i;
  9.     for (i = 0 ; i < 100 ; i++)
  10.     {
  11.         z = x * y;
  12.     }
  13. }

  14. int main()
  15. {
  16.     time_test();
  17.     return 0;
  18. }
复制代码


接下来该编译了(需要编译的语言好麻烦,:p)。Python提供了编译C的module的简单方法。就是写一个setup脚本:

  1. #! /usr/bin/python

  2. from distutils.core import setup, Extension

  3. module1 = Extension('timeC', sources = ['timeC.c', 'time_test.c'])

  4. setup (name = 'PackageName', version = '1.0', description = 'This is a demo package', ext_modules = [module1])
复制代码

只要执行一下./setup.py build,就可以编译了。
编译好了之后,把生成的.so文件copy到当前目录。Run一下main.py看看结果。我的机器是P4 1.8, RHEL4WS。结果如下:

  1. Python module time: 4.386378 seconds
  2. C module time: 0.000432 seconds
复制代码

论坛徽章:
0
2 [报告]
发表于 2005-06-15 16:37 |只看该作者

[有趣的Python 8] 使用C模块来提高性能

想看看,使用python封装C++类的例子

论坛徽章:
0
3 [报告]
发表于 2005-06-16 15:47 |只看该作者

[有趣的Python 8] 使用C模块来提高性能

我回头学习一下,看能不能再发个封装C++的。

论坛徽章:
0
4 [报告]
发表于 2005-06-16 22:21 |只看该作者

[有趣的Python 8] 使用C模块来提高性能

这个文档写得不是十分详细,建议将每段代码的文件名,具体的细节描述得更详细一些.其实作为技术文档,不仅需要熟悉python的人理解,更需要让初学python的人也能很好的理解并使用它.
谢谢你的知识共享!

论坛徽章:
0
5 [报告]
发表于 2005-06-17 07:57 |只看该作者

[有趣的Python 8] 使用C模块来提高性能

呵呵,你说的有道理。看来我写入门文章的能力还有待加强。主要是觉得很多知识在各个语言里都是相通的,所以写的时候可能更多的是假设读者已经对C/C++/Java有一定的了解。然后先有个感性认识,能把这些代码当作cheat sheet 用,是最大的目的,要是深究,我的Python知识实在是太有限了。刚学了没有多久,而且是业余自己看着玩的,要是有个项目,时间多些,估计能深入一些。

论坛徽章:
0
6 [报告]
发表于 2005-06-28 20:39 |只看该作者

[有趣的Python 8] 使用C模块来提高性能

个人觉得楼主是说清楚了的

论坛徽章:
0
7 [报告]
发表于 2006-06-22 10:43 |只看该作者
可以把Python作为一个调用触发工具,底层实现和逻辑封装使用高效的C来完成,这样效率就高了~ 也可以有效地保护底层代码

论坛徽章:
0
8 [报告]
发表于 2006-06-22 16:46 |只看该作者
能讲下ctypes么

论坛徽章:
0
9 [报告]
发表于 2006-06-24 08:11 |只看该作者
Python的代码为:
def time():
    for i in range(0,100000):
        x = 123498
        y = 98082432
        z = x * y

而C的代码为:
    for (i = 0 ; i < 100 ; i++)
    {
        z = x * y;
    }

所以,速度对比
Python module time: 4.386378 seconds
C module time: 0.000432 seconds
修正为:
C module time: 0.432 seconds
似乎更可信。 -> 10倍的差距。

论坛徽章:
0
10 [报告]
发表于 2006-06-24 09:14 |只看该作者
sorry, 我刚才的说法不确切。

我测试了一下。结果与楼主的相当。

但是,当我修改time_test.c中的循环次数为:10000, 10000000 时,结果C运行时间仍然没什么变化。所以,我怀疑:C中的z=x*y 被优化掉了。

我修改time_test.c如下:
void time_test()
{
    long x = 123498;
    long y = 98082432;
    long z = 0;
    int i;
    for (i = 0 ; i < 5000 ; i++)
    {
        z = x * y;
        printf("C:%ld\n", z)
    }
}

修改timeP.py如下:
def time():
    for i in range(0,5000):
        x = 123498
        y = 98082432
        z = x * y
        print 'P:', z

结果如下:
Python module time: 7.779405 seconds
C module time: 4.681235 seconds
又运行一次,结果:
Python module time: 2.736273 seconds
C module time: 0.262230 seconds
波动比较大。

timeP.py的输出为:5000行以下行:
P: 12112984187136
而 timeC的输出为:5000行以下行:
C: 1176412416
虽然使用了long ,但,C似乎还是溢出了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP