⽤Python下载⼀个⽹页保存为本地的HTML⽂件实例我们可以⽤Python来将⼀个⽹页保存为本地的HTML⽂件,这需要⽤到urllib库。
⽐如我们要下载⼭东⼤学新闻⽹的⼀个页⾯,该⽹页如下:
实现代码如下:
quest
def getHtml(url):
html = quest.urlopen(url).read()
return html
def saveHtml(file_name, file_content):
# 注意windows⽂件命名的禁⽤符,⽐如 /
with open(place('/', '_') + ".html", "wb") as f:
# 写⽂件⽤bytes⽽不是str,所以要转码
f.write(file_content)
aurl = "www.view.sdu.edu/info/1003/75240.htm"
html = getHtml(aurl)
html如何下载
saveHtml("sduview", html)
print("下载成功")
打开相应的⽬录可以看到这个⽹页已经被下载保存成功了
我们⽤浏览器打开这个⽹页⽂件如下
由于我们只是下载了⽹页的主要源码,其中的很多图⽚之类的⽂件都不在这⾥。因此这种⽅法只适⽤于提取⽂字内容。
以上这篇⽤Python下载⼀个⽹页保存为本地的HTML⽂件实例就是⼩编分享给⼤家的全部内容了,希望能给⼤家⼀个参考,也希望⼤家多多⽀持。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。