【Python】CSS选择器语法
常⽤语法
语法说明
*选择所有节点
#container选择id为container的节点
.container选择所有class包含container的节点
div,p 选择所有div 元素和所有 p 元素
li a选取所有li 下所有a节点
ul + p选取ul后⾯的第⼀个p元素div#container > ul选取id为container的div的第⼀个ul⼦元素ul ~p选取与ul相邻的所有p元素
a[title]选取所有有title属性的a元素a[href=”baidu”]选取所有href属性为baidu的a元素a[href*=”baidu”]选取所有href属性值中包含baidu的a元素
a[href^=”http”]选取所有href属性值中以http开头的a元素
a[href$=”.jpg”]选取所有href属性值中以.jpg结尾的a元素input[type=radio]:checked选择选中的radio的元素
div:not(#container)选取所有id为⾮container 的div属性li:nth-child(3)选取第三个li元素
li:nth-child(2n)选取第偶数个li元素
a::attr(href)选取a标签的href属性
css选择器分为哪几类
a::text选取a标签下的⽂本
使⽤⽰例
scrapy shellblog.jobbole/102337/
1.提取title
>>> response.css(".entry-header h1::text").extract()[0]
2.提取⽇期
>>> response.css("p.entry-meta-hide-on-mobile::text").extract()[0].strip()
3、提取点赞数
>>> response.css(".vote-post-up  h10::text").extract()[0]
4、提取收藏数
>>> response.css(".bookmark-btn::text").extract()[0]
5、提取评论数
>>> response.css("a[href='#article-comment'] span::text").extract()[0]
6.提取内容
>>> response.css (".entry").extract()[0]
7、提取tag标签
>>> response.css(".entry-meta-hide-on-mobile a::text").extract()

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。