python和C语言互相调用的几种方式

落日映苍穹つ 2022-05-13 03:16 237阅读 0赞






版权申明:本文为博主窗户(Colin Cai)原创,欢迎转帖。如要转贴,必须注明原文网址

 

http://www.cnblogs.com/Colin-Cai/p/7594551.html

 

作者:窗户

 

QQ:6679072

 

E-mail:6679072@qq.com

  

  Python这些年风头一直很盛,占据了很多领域的位置,Web、大数据、人工智能、运维均有它的身影,甚至图形界面做的也很顺,乃至full-stack这个词语刚出来的时候,似乎就是为了描述它。

  Python虽有GIL的问题导致多线程无法充分利用多核,但后来的multiprocess可以从多进程的角度来利用多核,甚至affinity可以绑定具体的CPU核,这个问题也算得到解决。虽基本为全栈语言,但有的时候为了效率,可能还是会去考虑和C语言混编。混编是计算机里一个不可回避的话题,涉及的东西很多,技术、架构、团队情况、管理、客户等各个环节可能对其都有影响,混编这个问题我想到时候再开一贴专门讨论。本文只讲python和C混编的方式,大致有如下几种方式(本文背景是linux,其他平台可以类比):

  

  共享库

  使用C语言编译产生共享库,然后python使用ctype库里的cdll来打开共享库。

  举例如下,C语言代码为

  1. /* func.c */
  2. int func(int a)
  3. {
  4. return a*a;
  5. }

  python代码为

复制代码

复制代码

  1. #!/usr/bin/env python
  2. #test_so.py
  3. from ctypes import cdll
  4. import os
  5. p = os.getcwd() + '/libfunc.so'
  6. f = cdll.LoadLibrary(p)
  7. print f.func(99)

复制代码

复制代码

  测试如下








1

2

3

$ gcc -fPIC -shared func.c -o libfunc.so

$ ./test_so.py

9801

  

  subprocess

  C语言设计一个完整的可执行文件,然后python通过subprocess来执行该可执行文件,本质上是fork+execve。

  举例如下,C语言代码为

复制代码

复制代码

  1. /* test.c */
  2. #include <stdio.h>
  3. int func(int a)
  4. {
  5. return a*a;
  6. }
  7. int main(int argc, char **argv)
  8. {
  9. int x;
  10. sscanf(argv[1], "%d", &x);
  11. printf("%d\n", func(x));
  12. return 0;
  13. }

复制代码

复制代码

  Python代码为

复制代码

  1. #!/usr/bin/env python
  2. # test_subprocess.py
  3. import os
  4. import subprocess
  5. subprocess.call([os.getcwd()+'/a.out', '99'])

复制代码

  测试如下








1

2

3

$ gcc test.c -o a.out

$ ./test_subprocess.py

9801

  

  C语言中运行python程序

  C语言使用popen/system或者直接以系统调用级fork+exec来运行python程序也是一种混编的手段了。

  举例如下,Python代码如下

  1. #!/usr/bin/env python
  2. # test.py
  3. import sys
  4. x = int(sys.argv[1])
  5. print x*x

  C语言代码如下

复制代码

复制代码

  1. /* test.c */
  2. #include <stdio.h>
  3. #include <stdlib.h>
  4. int main()
  5. {
  6. FILE *f;
  7. char s[1024];
  8. int ret;
  9. f = popen("./test.py 99", "r");
  10. while((ret=fread(s,1,1024,f))>0) {
  11. fwrite(s,1,ret,stdout);
  12. }
  13. fclose(f);
  14. return 0;
  15. }

复制代码

复制代码

  测试如下








1

2

3

$ gcc test.c

$ ./a.out

9801

  

  python对C语言扩展的支持

  很多编程语言都为C语言扩展添加了支持,这有两种原因:(1)语言设计之初,可以充分的利用C语言已有的库来做很多扩展;(2)C语言的运行效率高。

  python也不例外,从诞生那天起,很多库都是C语言写的。python的C语言扩展中涉及到python的数据结构与C语言的对应,扩展方法其实是用C语言编写一个共享库,只是这个共享库中的接口是一个规范的,可以被python识别的。

  为了说明如何扩展,我这里先假设一个在python下的函数功能,代码如下

  1. def func(*a):
  2. res=1
  3. for i in range(len(a)):
  4. res *= sum(a[i])
  5. return res

  如上,希望的函数功能是,参数是任意多个数字组成的列表(姑且排除其他数据结构),返回每个列表的元素之和的乘积。

  姑且先把python代码写了,如下所示

复制代码

复制代码

  1. #!/usr/bin/env python
  2. # test.py
  3. import colin
  4. def func(*a):
  5. res=1
  6. for i in range(len(a)):
  7. res *= sum(a[i])
  8. return res
  9. a = [1,2,3]
  10. b = [4,5,6]
  11. c = [7,8]
  12. d = [9]
  13. e = [10,11,12,13,14]
  14. f = colin.func2(99)
  15. g = colin.func3(a,b,c,d,e)
  16. h = func3(a,b,c,d,e)
  17. print "f = ",f
  18. print "g = ",g
  19. print "h = ",h

复制代码

复制代码

  带上之前一直测试的平方func,这个实现相对简单,希望python写出来的func可以和C语言扩展出来的结果一致。

  先用C语言写上这些函数的实现,其中func3用上了一个表示任意多个任意长的数组的数据结构y_t,而x_t用来表示单个数组。

复制代码

复制代码

  1. /* colin.h */
  2. #ifndef Colin_h
  3. #define Colin_h
  4. typedef struct {
  5. int *a;
  6. int len;
  7. } x_t;
  8. typedef struct {
  9. x_t *ax;
  10. int len;
  11. } y_t;
  12. int func2(int a);
  13. int func3(y_t *p);
  14. void free_y_t(y_t *p);
  15. #endif

复制代码

复制代码

  

复制代码

复制代码

  1. /* colin.c */
  2. #include "colin.h"
  3. #include <stdlib.h>
  4. int func2(int a)
  5. {
  6. return a*a;
  7. }
  8. int func3(y_t *p)
  9. {
  10. int result;
  11. int sum;
  12. int i, j;
  13. result = 1;
  14. for(i=0;i<p->len;i++) {
  15. sum = 0;
  16. for(j=0;j<p->ax[i].len;j++)
  17. sum += p->ax[i].a[j];
  18. result *= sum;
  19. }
  20. return result;
  21. }
  22. void free_y_t(y_t *p)
  23. {
  24. int i;
  25. for(i=0;i<p->len;i++) {
  26. free(p->ax[i].a);
  27. }
  28. free(p->ax);
  29. }

复制代码

复制代码

  上面定义了三个函数,func2代表平方,func3代表之前所说的功能,又因y_t这个结构可能都是动态分配出来的,所以给个归还内存的方法。

  刚才说过python扩展的话,需要把这个共享库的接口“标准化”一下。于是我们就包装一下,并给个python加载的入口。

复制代码

复制代码

  1. /* wrap.c */
  2. #include <Python.h>
  3. #include <stdlib.h>
  4. #include "colin.h"
  5. PyObject* wrap_func2(PyObject* self, PyObject* args)
  6. {
  7. int n, result;
  8. /* 从参数列表中导出一个整形,用"i" */
  9. if (!PyArg_ParseTuple(args, "i", &n))
  10. return NULL;
  11. /* 用C语言的库实现来计算 */
  12. result = func2(n);
  13. /* 计算结果必须要导成python识别的类型 */
  14. return Py_BuildValue("i", result);
  15. }
  16. PyObject* wrap_func3(PyObject* self, PyObject* args)
  17. {
  18. int n, result;
  19. int i, j;
  20. int size, size2;
  21. PyObject *p,*q;
  22. y_t *y;
  23. y = malloc(sizeof(y_t));
  24. /* 先数数有多少个参数,也就是列表的个数 */
  25. size = PyTuple_Size(args);
  26. /* 把数组的个数先分配了 */
  27. y->len = size;
  28. y->ax = malloc(sizeof(x_t)*size);
  29. /* 遍历python里各个列表(参数) */
  30. for(i=0;i<size;i++) {
  31. /* 先获得第i个参数,是一个列表 */
  32. p = PyTuple_GetItem(args, i);
  33. /* 获得列表的长度 */
  34. size2 = PyList_Size(p);
  35. /* 为数组分配好空间 */
  36. y->ax[i].len = size2;
  37. y->ax[i].a = malloc(sizeof(int)*size2);
  38. /* 遍历列表,依次把列表里的数转到数组里 */
  39. for(j=0;j<size2;j++) {
  40. q = PyList_GetItem(p, j);
  41. PyArg_Parse(q,"i",&y->ax[i].a[j]);
  42. }
  43. }
  44. /* 用C语言的库实现来计算 */
  45. result = func3(y);
  46. free_y_t(y);
  47. free(y);
  48. /* 结果转成python识别格式 */
  49. return Py_BuildValue("i", result);
  50. }
  51. /* 这是接口列表,加载时是只加载此列表的地址,所以这个数据结构不能放栈(局部变量)内,会被清掉 */
  52. static PyMethodDef colinMethods[] =
  53. {
  54. {"func2", wrap_func2, METH_VARARGS, "Just a test"},
  55. {"func3", wrap_func3, METH_VARARGS, "Just a test"},
  56. {NULL, NULL, METH_NOARGS, NULL}
  57. };
  58. /* python加载的时候的接口 */
  59. /* 注意,既然库名叫colin,此函数必须交initcolin */
  60. void initcolin()
  61. {
  62. PyObject *m;
  63. m = Py_InitModule("colin", colinMethods);
  64. }

复制代码

复制代码

  过程中,我猜测PyArg_VaParse应该功能更为强大,可是反复测没有成功,也没细看文档。

  测试一下








1

2

3

4

5

$ gcc -I /usr/include/python2.7/ -fPIC -shared colin.c wrap.c -o colin.so

$ ./test.py

f =  9801

g =  729000

h =  729000

  可以看到,C语言写的函数和python写的函数结果一致。

发表评论

表情:
评论列表 (有 0 条评论,237人围观)

还没有评论,来说两句吧...

相关阅读