集成富文本编辑器XSS预防过滤措施--688IT编程网

集成富⽂本编辑器XSS预防过滤措施#

import re

import copy

from html.parser import HTMLParser

class XSSHtml(HTMLParser):

allow_tags = ['a', 'img', 'br', 'strong', 'b', 'code', 'pre',

'p', 'div', 'em', 'span', 'h1', 'h2', 'h3', 'h4',

'h5', 'h6', 'blockquote', 'ul', 'ol', 'tr', 'th', 'td',

'hr', 'li', 'u', 'embed', 's', 'table', 'thead', 'tbody',

'caption', 'small', 'q', 'sup', 'sub', 'font']

common_attrs = ["style", "class", "name"]

nonend_tags = ["img", "hr", "br", "embed"]

tags_own_attrs = {

"img": ["src", "width", "height", "alt", "align"],

"a": ["href", "target", "rel", "title"],

"embed": ["src", "width", "height", "type", "allowfullscreen", "loop", "play", "wmode", "menu"],

"table": ["border", "cellpadding", "cellspacing"],

"font": ["color"]

}

def __init__(self, allows=[]):

HTMLParser.__init__(self)

self.allow_tags = allows if allows else self.allow_tags

self.start = []

self.data = []

def __enter__(self):

return self

def __exit__(self, exc_type, exc_val, exc_tb):

super().close()

def clean(self, content):

self.feed(content)

_html()

def get_html(self):

"""

Get the safe html code

"""

for i in range(0, sult)):

sult[i].strip('\n'):

self.data.sult[i])

return ''.join(self.data)

def handle_startendtag(self, tag, attrs):

self.handle_starttag(tag, attrs)

def handle_starttag(self, tag, attrs):

if tag not in self.allow_tags:

return

end_diagonal = ' /' if tag d_tags else ''

if not end_diagonal:

self.start.append(tag)

attdict = {}

for attr in attrs:

attdict[attr[0]] = attr[1]

attdict = self._wash_attr(attdict, tag)

if hasattr(self, "node_%s" % tag):

attdict = getattr(self, "node_%s" % tag)(attdict)

else:

attdict = de_default(attdict)

attrs = []

for (key, value) in attdict.items():

attrs.append('%s="%s"' % (key, self._htmlspecialchars(value)))

attrs = (' ' + ' '.join(attrs)) if attrs else ''

def handle_endtag(self, tag):

if self.start and tag == self.start[len(self.start) - 1]:

self.start.pop()

def handle_data(self, data):

def handle_entityref(self, name):

if name.isalpha():

def handle_charref(self, name):

if name.isdigit():

def node_default(self, attrs):

attrs = self._common_attr(attrs)

return attrs

def node_a(self, attrs):

attrs = self._common_attr(attrs)

attrs = self._get_link(attrs, "href")

attrs = self._set_attr_default(attrs, "target", "_blank") attrs = self._limit_attr(attrs, {

"target": ["_blank", "_self"]

})

return attrs

def node_embed(self, attrs):

attrs = self._common_attr(attrs)

attrs = self._get_link(attrs, "src")

attrs = self._limit_attr(attrs, {

"type": ["application/x-shockwave-flash"],

"wmode": ["transparent", "window", "opaque"],

"play": ["true", "false"],

"loop": ["true", "false"],

"menu": ["true", "false"],

"allowfullscreen": ["true", "false"]

})

attrs["allowscriptaccess"] = "never"

attrs["allownetworking"] = "none"

return attrs

def _true_url(self, url):

prog = repile(r"^(http|https|ftp)://.+", re.I | re.S)

if prog.match(url):

return url

else:

return "%s" % url

def _true_style(self, style):

if style:

style = re.sub(r"(\\|&#|/\*|\*/)", "_", style)

style = re.sub(r"e.*x.*p.*r.*e.*s.*s.*i.*o.*n", "_", style) return style

def _get_style(self, attrs):

if "style" in attrs:

attrs["style"] = self._true_("style"))

return attrs

def _get_link(self, attrs, name):

if name in attrs:

attrs[name] = self._true_url(attrs[name])

return attrs

def _wash_attr(self, attrs, tag):

if tag in self.tags_own_attrs:

other = self.tags_(tag)

else:

other = []

if attrs:

for key, value in copy.deepcopy(attrs).items():

if key not in selfmon_attrs + other:

del attrs[key]

return attrs

def _common_attr(self, attrs):

attrs = self._get_style(attrs)

return attrs

def _set_attr_default(self, attrs, name, default=''):

if name not in attrs:

attrs[name] = default

return attrs

def _limit_attr(self, attrs, limit={}):

for (key, value) in limit.items():

if key in attrs and attrs[key] not in value:

del attrs[key]

return attrs

def _htmlspecialchars(self, html):

place("<", "<") \

.replace(">", ">") \

.replace('"', """) \

.replace("'", "'")

if "__main__" == __name__:

with XSSHtml() as parser:

ret = parser.clean("""<p><img src=1 onerror=alert(/xss/)></p><div class="left">

<img onerror=alert(1) src=#>""")

print(ret)

1from urlparse import urlparse

3import bleach

6class XSSFilter(object):

7 tags = ['p', 'div', 'img', 'br', 'span', 'pre', 'code', 'blockquote', 'ol', 'ul', 'li']

8 styles = [

9'max-width', 'color', 'margin', 'line-height', 'display', 'padding', 'background-color',

10'display', 'border-left', 'font-family', 'white-space', 'font-size'

11 ]

13 @staticmethod

14def allowed_src(tag, name, value):

15if name in ('style', 'src', 'alt', 'data-w-e'):

html富文本框16return True

17if name == 'src':

18 p = urlparse(value)

19return XSSFilter._trusted_url(p)

20return False

22 @classmethod

23def clean(cls, html):

24return bleach.clean(html, tags=cls.tags, attributes=cls.allowed_src, styles=cls.styles) 25

26 @classmethod

27def _trusted_url(cls, url):

28return urlloc == ''or'static/gif'in url.path

688IT编程网

集成富文本编辑器XSS预防过滤措施

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

集成富文本编辑器XSS预防过滤措施

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式