find_all()方法的用法
find_all() 方法是BeautifulSoup中非常重要的一个方法,它是用来查文档中所有与输入给定的参数匹配标签元素集合的。它可以搜索文档字段,或用对象属性进行查,返回在参数定、查询查条件匹配的所有实例集合,结果呈列表形式返回。
find_all()方法的参数有两种类型:name 和 attrs 。name参数指定用来搜索的标签类型,而attrs参数可以搜索带有指定属性值的标签,这两个参数的值可以是字符串、正则表达式、方法,或者列表。
一般情况下,name参数只能指定一个标签,而attrs参数可以指定多个属性,比如id, class, href,text等。如果attrs参数只指定了一个属性,find_all()方法将查文档中所有带有指定属性的标签元素;如果attrs参数指定了多个属性,find_all()方法将查文档中所有符合这些属性值的标签元素。另外,attrs参数还支持字典参数,比如:attrs={'name':'keywords','class':'content'},将匹配文档中名为“keywords”、类名为“content”的标签元素。
使用BeautifulSoup的find_all()方法时,要注意将搜索参数写入正确的顺序,即标签类型放在第一个参数,属性列表放在第二个参数,否则find_all()将无法运行,并返回空列表。此外,对空白字符也有一定要求:空白字符必须跟随其它字符,以便增加字符串的可读性。例如,当查有class属性的div时,应写成<div class="test">,而不能写成<div class="test">或<div
class = "test" >。
使用BeautifulSoup的find_all()方法出文档中所有匹配的标签元素后,就可以使用.contents 方法返回元素的子节点,从而获取其中的文本,或者使用.attrs属性返回元素的属性,从而查看元素的属性大全。
queryselectorall用法 总结一下find_all()方法,它主要用于查文档中所有与输入参数匹配的标签元素集合,参数可指定是name参数或者attrs参数;name参数用来指定用来搜索的标签,attrs参数用来搜索带有指定属性值的标签;使用find_all()方法时,参数空白字符要跟随其它字符,以便增加字符串的可读性;使用find_all()返回结果后,还可以使用.contents 方法返回元素的子节点,以获取文本,或使用.attrs属性返回元素的属性,查看属性大全。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论