python爬取a标签内href的方法及遇到的问题--688IT编程网

python爬取a标签内href的⽅法及遇到的问题原博客地址：

1# -*- coding:utf-8 -*-

2#python 2.7

3#XiaoDeng

4#tieba.baidu/p/2460150866

5#标签操作

8from bs4 import BeautifulSoup

quest

10import re

13#如果是⽹址，可以⽤这个办法来读取⽹页

14#html_doc = "tieba.baidu/p/2460150866"

15#req = quest.Request(html_doc)

16#webpage = quest.urlopen(req)

17#html = ad()

21 html="""

22<html><head><title>The Dormouse's story</title></head>

23<body>

24The Dormouse's story

25Once upon a time there were three little sisters; and their names were

26<a href="example/elsie" class="sister" id="xiaodeng"></a>,

27<a href="example/lacie" class="sister" id="link2">Lacie</a> and

28<a href="example/tillie" class="sister" id="link3">Tillie</a>;

href标签怎么用

29<a href="example/lacie" class="sister" id="xiaodeng">Lacie</a>

30and they lived at the bottom of a well.

31...

32"""

33 soup = BeautifulSoup(html, 'html.parser') #⽂档对象

36#查a标签，只会查出⼀个a标签

37#print(soup.a)#<a class="sister" href="example/elsie" id="xiaodeng"></a>

39for k in soup.find_all('a'):

40print(k)

41print(k['class'])#查a标签的class属性

42print(k['id'])#查a标签的id值

43print(k['href'])#查a标签的href值

44print(k.string)#查a标签的string

('calss')，也可以达到这个效果

在使⽤该⽅法的k['href']读取⽹页链接时，编译器报错：

KeyError: 'href'

修改为：

<('href')

成功运⾏，取出href中的链接。

发表评论

688IT编程网

python爬取a标签内href的方法及遇到的问题

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

python爬取a标签内href的方法及遇到的问题

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式