python、CC++混合编程实例简析--688IT编程网

python、CC++混合编程实例简析

TIOBE每个⽉都会新鲜出炉⼀份流⾏编程语⾔排⾏榜，这⾥会列出最流⾏的20种语⾔。排序说明不了语⾔的好坏，反应的不过是某个软件开发领域的热门程度。语⾔的发展不是越来越common，⽽是越来越专注领域。有的语⾔专注于简单⾼效，⽐如python，内建的list，dict结构⽐c/c++易⽤太多，但同样为了安全、易⽤，语⾔也牺牲了部分性能。在有些领域，⽐如通信，性能很关键，但并不意味这个领域的coder只能苦苦挣扎于c/c++的陷阱中，⽐如可以使⽤多种语⾔混合编程。

我看到的⼀个很好的Python与c/c++混合编程的应⽤是NS3（Network Simulator3）⼀款⽹络模拟软件，它的内部计算引擎需要⽤⾼性能，但在⽤户建模部分需要灵活易⽤。NS3的选择是使⽤C/C++来模拟核⼼部件和协议，⽤python来建模和扩展。

这篇⽂章介绍python和c/c++三种混合编程的⽅法，并对性能加以分析

混合编程的原理

⾸先要说⼀下python只是⼀个语⾔规范，实际上python有很多实现：CPython是标准Python，是由C编写的，python脚本被编译成CPython 字节码，然后由虚拟机解释执⾏，垃圾回收使⽤引⽤计数，我们谈与C/C++混合编程实际指的是基于CPython解释上的。除此之外，还有Jython、IronPython、PyPy、Pys

ton，Jython是Java编写的，使⽤JVM的垃圾回收，可以与Java混合编程，IronPython⾯向.NET平台。python与C/C++混合编程的本质是python调⽤C/C++编译的动态链接库，关键就是把python中的数据类型转换成c/c++中的数据类型，给编译函数处理，然后返回参数再转换成python中的数据类型。

python中使⽤ctypes moduel，将python类型转成c/c++类型

⾸先，编写⼀段累加数值的c代码：

extern "C"

{

int addBuf(char* data, int num, char* outData);

}

int addBuf(char* data, int num, char* outData)

{

for (int i = 0; i < num; ++i)

{

outData[i] = data[i] + 3;

}

return num;

}

然后，将上⾯的代码编译成so库，使⽤下⾯的编译指令

>gcc -pthread -fno-strict-aliasing -g -O2 -DNDEBUG -g -fwrapv -O3 -Wall -Wstrict-prototypes -fPIC addbuf.c -o addbuf.o

最后编写python代码，使⽤ctypes库，将python类型转换成c语⾔需要的类型，然后传参调⽤so库函数：

from ctypes import * # cdll, c_int

lib = cdll.LoadLibrary('libmathBuf.so')

callAddBuf = lib.addBuf

num = 4

numbytes = c_int(num)

data_in = (c_byte * num)()

for i in range(num):

data_in[i] = i

data_out = (c_byte * num)()

ret = lib.addBuf(data_in, numbytes, data_out) #调⽤so库中的函数

在C/C++程序中使⽤Python.h，写wrap包装接⼝

这种⽅法需要修改c/c++代码，在外部函数中处理⼊/出参，适配python的参数。写⼀段c代码将外部⼊参作为shell命令执⾏

#include <Python.h>

static PyObject* SpamError;

static PyObject* spam_system(PyObject* self, PyObject* args)

{

const char* command;

int sts;

if (!PyArg_ParseTuple(args, "s", &command)) //将args参数按照string类型处理，给command赋值

return NULL;

sts = system(command); //调⽤系统命令

if (sts < 0) {

PyErr_SetString(SpamError, "System command failed");

return NULL;

}

return PyLong_FromLong(sts); //将返回结果转换为PyObject类型

}

//⽅法表

static PyMethodDef SpamMethods[] = {

{"system", spam_system, METH_VARARGS,

"Execute a shell command."},

{NULL, NULL, 0, NULL}

};

//模块初始化函数

PyMODINIT_FUNC initspam(void)

{

PyObject* m;

//m = PyModule_Create(&spammodule); // v3.4

m = Py_InitModule("spam", SpamMethods);

if (m == NULL)

return;

SpamError = PyErr_NewException("",NULL,NULL);

Py_INCREF(SpamError);

PyModule_AddObject(m,"error",SpamError);

}

处理上所有的⼊参、出参都作为PyObject对象来处理，然后使⽤转换函数把python的数据类型转换成c/

c++中的类型，返回参数按相同⽅式处理。⽐第⼀种⽅法多了初始化函数，这部分是把编译的so库当做python module所必需要做的。

python这样使⽤：

imoprt spam

spam.system("ls")

使⽤SWIG，来⽣成独⽴的wrap⽂件

这种⽅式并不能算是⼀种新⽅式，实际上是基于第⼆中⽅式的⼀种包装。SWIG是个帮助使⽤C或者C++编写的软件能与其它各种⾼级编程语⾔进⾏嵌⼊联接的开发⼯具。SWIG能应⽤于各种不同类型的语⾔包括常⽤脚本编译语⾔例如Perl, PHP, Python, Tcl, Ruby,

PHP，C#,Java,R等。

操作上，是针对c/c++程序编写独⽴的接⼝声明⽂件（通常很简单），swig会分析c/c++源程序⾃动分析接⼝要如何包装。在指定⽬标语⾔后，swig会⽣成额外的包装源码⽂件。编译so库时，把包装⽂件⼀起编译、连接即可。看个c代码例⼦：

int system(const char* command)

{

sts = system(command);

if (sts < 0) {

return NULL;

}

return sts;

}

c源码中去掉适配python的包装，仅定义system函数本⾝，这⽐第⼆种⽅式简洁很多，并且剔除了c代码与python的耦合代码，是c代码通⽤性更好。

然后编写swig接⼝声明⽂件spam.i：

%module spam

#include "spam.h"

%include "spam.h"

%include "typemaps.i"

int system(const char* INPUT);

这是⼀段语⾔⽆关的模块声明，要创建⼀个叫spam的模块，对system做⼀个声明，主要是声明参数作为⼊参使⽤。然后执⾏swig编译程序：

>swig -c++ -python spam.i

swig会⽣成和spam.py两个⽂件。先看，这个⽣成的⽂件很长，但关键的就是对函数的包装：

包装函数传⼊的还是PyObejct对象，内部进⾏了类型转换，最终调了源码中的system函数。

⽣成的了另⼀个spam.py实际上是对so库⼜⽤python包装了⼀层（实际⽐较多余）：

python+C、C++混合编程的应⽤

这⾥使⽤_spam模块，这⾥实际上是把扩展命名为了_spam。关于swig在python上的应⽤可以参见：

/Doc1.3/Python.html

下⾯就是编译和安装python 模块，Python提供了distutils module，可以很⽅便的编译安装python的module。像下⾯这样写⼀个安装脚本setup.py:

python+C、C++混合编程的应⽤

执⾏ python setup.py build，即可以完成编译，程序会创建⼀个build⽬录，下⾯有编译好的so库。so库放在当前⽬录下，其实Python就可以通过import来加载模块了。当然也可以⽤ python setup.py install 把模块安装到语⾔的扩展库——site-packages⽬录中。关于build python扩展，可以参考/2/extending/building.html#building

混合编程性能分析

混合编程的使⽤场景中，很重要⼀个就是性能攸关。那么这⼩节将通过⼏个⼩实验验证下混合编程的性能如何，或者说怎样写程序能发挥好混合编程的性能优势。

我们使⽤冒泡排序算法来验证性能。

1）实验⼀使⽤冒泡程序验证python和c/c++程序的性能差距

python版冒泡程序：

def bubble(arr,length):

j = length - 1

while j >= 0:

i = 0

while i < j:

if arr[i] > arr[i+1]:

tmp = arr[i+1]

arr[i+1] = arr[i]

arr[i] = tmp

i += 1

j -= 1

c语⾔版冒泡排序

void bubble(int* arr,int length){

int j = length - 1;

int i;

int tmp;

while(j >= 0){

i = 0;

while(i < j){

if(arr[i] > arr[i+1]){

tmp = arr[i+1];

arr[i+1] = arr[i];

arr[i] = tmp;

}

i += 1;

}

j -= 1;

}

使⽤⼀个长度为100内容固定的数组，反复排序10000次（每次排序后，再把数组恢复成原始序列），记录执⾏时间：

在相同的机器上多次执⾏，Python版执⾏时间是10.3s左右，⽽c语⾔版本(未使⽤任何优化编译参数)执⾏时间只有0.29s左右。相⽐之下python的性能的确差很多（主要是python中list的操作跟c的数组相⽐，效率差⾮常多），但python中很多扩展都是c语⾔写的，⽬的就是为了提升效率，python⽤于数据分析的numpy库就拥有不错的性能。下个实验就验证，如果python使⽤c语⾔版本的冒泡排序扩展库，性能会提升多少。

2）实验⼆ python语⾔使⽤ctypes⽅式调⽤

这⾥直接使⽤c_int来定义了数组对象，这也节省了调⽤时数据类型转换的开销：

import time

from ctypes import *

IntArray100 = c_int * 100

arr = IntArray100(87,23,41, 3, 2, 9,10,23,0,21,5,15,93, 6,19,24,18,56,11,80,34, 5,98,33,11,25,99,44,33,78,

python新手代码例子52,31,77, 5,22,47,87,67,46,83, 89,72,34,69, 4,67,97,83,23,47, 69, 8, 9,90,20,58,20,13,61,99,7,22,55,11,30,56,87,29,92,67,

99,16,14,51,66,88,24,31,23,42,76,37,82,10, 8, 9, 2,17,84,32,66,77,32,17, 5,68,86,22, 1, 0)

... ...

if __name__ == "__main__":

libbubble = CDLL('libbubble.so')

time1 = time.time()

for i in xrange(100000):

libbubble.initArr(arr1,arr,100)

libbubble.bubble(arr1,100)

time2 = time.time()

print time2 - time1

再次执⾏：

为了减少误差，把循环增加到10万次，结果c原⽣程序使⽤优化参数编译后⽤时0.65s左右。python使⽤c扩展后（相同编译参数）执⾏仅需2.3s左右。

3）实验三在c语⾔中使⽤PyObject处理⼊参

这种⽅式是在python中依然使⽤list装⼊待排序数列，在c函数中把list赋值给数组，再进⾏排序，排好序后，再对原始list赋值。循环排序10万次，执⾏⽤时1.0s左右。

4) 实验四使⽤swig来包装c⽅法

在接⼝⽂件中声明%array_class(int,intArray)；然后在Python中使⽤initArray来作为数组，同样修改成10万次排序。python版本的程序(相同编译参数)执⾏仅需0.7s左右，⽐c原⽣程序慢⼤概7%。

结论

1.python 的list效率⾮常低，在⾼性能场景下避免对list⼤量循环、取值、赋值操作。如需要最好使⽤ctype中的数组，或者是⽤c语⾔来实现。

2.应该把耗时的cpu密集型的逻辑交给c/c++实现，python使⽤扩展即可。

688IT编程网

python、CC++混合编程实例简析

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python、CC++混合编程实例简析

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式