用python下载百度文库的代码--688IT编程网

⽤python下载百度⽂库的代码

先去下载⼀个叫SWFToImage.dll的东西

再建⽴⼀个bat⽂件，并运⾏：

复制代码代码如下:

COPY SWFToImage.dll %windir%\system32

regsvr32 %windir%\system32\SWFToImage.dll

复制代码代码如下:

#⽤python下载百度⽂库的代码，需要的同志请修改，下⾯有提⽰

#wwwblogs/dearplain/

#code by plain

import urllib2

import win32com.client

import os

import sys

if __name__=='__main__':

#os.system('');

os.chdir('D:\my project\pywenku')#保存到哪个⽂件夹

SWFToImage=win32com.client.Dispatch("{479A1AAC-C148-40BB-9868-A9773DA66AF9}");

'''

allfile=os.listdir(".")

findrecord=0

for file in allfile:

if file==".record":

record=open(file,'rw')

findrecord=1

break

if findrecord==0:

record=open('.record','w')

'''

#url="wenku.baidu/view/8d3ed840be1e650e52ea9938.html?from=rec&pos=1&weight=2&lastweight=2&count=5" #url="wenku.baidu/view/f2fe7a3987c24028915fc37a.html?from=related&hasrec=1"

#url就是你要下载的⽂档的地址

url=sys.argv[1]

if url.find("")!=0:

print "error! the url is not correct"

print "downloading %s"%url

try:

urlReferer=url[url.index('http'):url.index('/v')]

print urlReferer

#urlbody=url[url.index('/v')-1:]

urlnum=url[url.index('ew/')+3:url.index('.htm')]

except ValueError:

print "parse url error"

#print urlnum

wenku='wenku.baidu'

reurl='/play/'

pagefrom='?pn='

downnum='&rn='

#try to get title and make dir

req=urllib2.Request(url)

学自学python要多久

res=urllib2.urlopen(req)

ad()

try:

sfrom=data.index('<title>')+len('<title>')

素还真为什么不出场了#print sfrom

sbefore=sfrom+data[sfrom:].index('</title>')

#print sbefore

title=data[sfrom:sbefore]

title=title[:title.rindex('_')]

print 'downloading '+title

except ValueError:

print "get title error"

allfile=os.listdir(".")

if (title in allfile)==False:

极速浏览器进程快捷键

os.mkdir(title)

os.chdir('./'+title)

#get the first swf

req=urllib2.Request('wenku.baidu'+reurl+urlnum+pagefrom+'1'+downnum+'1') req.add_header("Referer", urlReferer )

res=urllib2.urlopen(req)

ad()

res.close()

head=data[0:45]

pagenum=0

sfrom=head.index('\":\"')+len('\":\"')

sbefore=sfrom+head[sfrom:].index('\"')

pagenum=int(head[sfrom:sbefore])

print 'pagenum:'+str(pagenum)folder和file

if pagenum<=0 or pagenum>2000:

print "errorpagenum<0 or pagenum>2000"

data=data[106:]

swf=open("1.pywenku",'wb')

python基础代码大全下载swf.write(data)

swf.close()

i=1

SWFToImage.InputSWFFileName="%d.pywenku"%i

SWFToImage.ImageOutputType = 1

SWFToImage.ImageWidth=1048

SWFToImage.ImageHeight=1478

SWFToImage.Execute_Begin()

SWFToImage.FrameIndex = 1

SWFToImage.Execute_GetImage()

SWFToImage.SaveToFile("%d.jpg"%i)

SWFToImage.Execute_End()

王者荣耀空格代码复制粘贴

allfile=os.listdir(".")

#从第⼆页下到最后⼀页

for i in range(2,pagenum+1):

if '%d.swf'%i in allfile:

continue

#not find in the dir mean

req=urllib2.Request('wenku.baidu'+reurl+urlnum+pagefrom+str(i)+downnum+'1') res=urllib2.urlopen(req)

ad()

data=data[106:]

swf=open("%d.pywenku"%i,'wb')

swf.write(data)

swf.close()

SWFToImage.InputSWFFileName="%d.pywenku"%i

SWFToImage.ImageOutputType = 1

SWFToImage.Execute_Begin()

SWFToImage.FrameIndex = 1

SWFToImage.Execute_GetImage() SWFToImage.SaveToFile("%d.jpg"%i) SWFToImage.Execute_End()

print 'task complete'

688IT编程网

用python下载百度文库的代码

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

688IT编程网

用python下载百度文库的代码

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林 的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表

随机森林的算法