python⾃动从指定⽹页下载⽂件_Python–从⽹站登录和下载特
定⽂件
您链接的⽹站使⽤基于HTTP POST的登录.在您的代码中,您有:
resp = (url, auth=(user, password))
要登录此站点,您需要两件事:
>持久会话cookie
>登录表单URL的HTTP POST请求
s = requests.Session()
接下来,您需要使⽤GET请求访问⽹站.这将为您⽣成cookie(服务器将为您的会话发送cookie).
<(site_url)
最后⼀步将是登录⽹站.您可以使⽤Firebug或Chrome Developer Console(取决于您使⽤的浏览器)来检查需要发送的字段(转到“⽹
络”选项卡).
s.post(site_url, data={'_username': 'user', '_password': 'pass'})
这两个字段(_username,_password)似乎对您的站点有效,但是当我检查在POST请求期间发送的数据时,还有更多字段.我不知道他们是否有必要.
之后,您将通过⾝份验证.接下来将访问您要下载的⽂件的URL.
<(file_url)网页html下载
您提供的链接包含查询字符串,其中包含可能与您要突出显⽰的选项相关的各种选项.您可以使⽤它来下载具有所需选项的⽂件.
警告说明
请注意,此站点未使⽤HTTPS安全连接.您将提供的任何凭据都将通过互联⽹进⾏未加密,并且可能会被不应该看到它们的⼈看到.

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。