从网页采集图片,生成PPT文件--688IT编程网

从⽹页采集图⽚，⽣成PPT⽂件

家⾥领导下了⼀个任务，把⼀个⽹页转成PPT。⽹页上有⼏⼗个图⽚，转成PPT，每个页⾯⼀个图⽚。说要是做的好，以后还有类似的⽹页要转。作为新时代的码农，总不能⽤CTRL+C 和 CTRL+V解决嘛。

先分析⽹页。图⽚代码如下：

到下载链接。

上bs4 和 pptx库，当然少不了 Faker

import requests

from bs4 import BeautifulSoup

from pptx import Presentation

from pptx.util import Inches

import os

from faker import Factory

本段代码只适合爬取1页图⽚，如那种多页的，需要做判断，循环完成。

# encoding: utf-8

"""

@author: 陈年椰⼦

@contact: hndm@qq

@version: 1.0

@project:test

@file: web2ppt.py

@time: 2021-7-5 11:11

说明

从⽹页采集图⽚，⽣成PPT

"""

import requests

from bs4 import BeautifulSoup

from pptx import Presentation

from pptx.util import Inches

import os

from faker import Factory

# ⽣成user-agent

fc = ate()

header = {

"User-Agent": fc.user_agent()

}

# 图⽚缓存⽬录

img_path = "D:\\temp\\IMG\\"

# PPT⽂件

ppt_file = "D:\\temp\\ppt1.ppt"

#创建ppt

prs = Presentation()

#图⽚放置位置

left, top, width, height = Inches(1), Inches(0.5), Inches(8), Inches(6)

# 采集代码

resposne = ("mp.weixin.qq/s/A0-RIvL0QttGgogNkPwmfw") ding="utf-8"

soup = ,"lxml")

a = soup.find_all("img")

print("下载图⽚" , len(a))

p_index = 0

for j in a:

# print(j)

try:

# 注意分析你要采集的页⾯，图⽚下载链接

img = j['data-src']

p_index = p_index + 1

name = "pic{}".format(p_index)

# 获取图⽚地址

imgname = name + ".jpg"

conteng = (img)

# 图⽚⼆进制

er = t

with open(img_path + imgname, "wb") as file:

print("正在下载图⽚ {}" .format(imgname))

file.write(er)

file.flush()

# 创建⼀个空⽩ppt

ppt = prs.slide_layouts[6]

# 添加到ppt中

ppts = prs.slides.add_slide(ppt)

# 空⽩ppt添加下载的图⽚

pic = ppts.shapes.add_picture(img_path + imgname, left, top, width, height) except:

pass

continue

prs.save(ppt_file)

# 如需保留图⽚，以下代码注释掉。

如何制作网页文件

files= os.listdir(img_path)

if files:

for k in files:

print("正在删除图⽚ {}".format(k))

688IT编程网

从网页采集图片,生成PPT文件

发表评论

推荐文章

mongodb中match多个条件

纯数字正则表达式

zipkin tagquery用法

excel匹配正则 -回复

re正则匹配之findall

热门文章

js 数值型验证正则

oracle模糊查询正则

符合ca91的社会信用代码的正则表达式

C#中使用正则表达式校验输入的是否为英文字母【转载自】

Java正则表达式验证至少6位表达式中至少包含数字大小写字母中的一种

强密码校验正则

hive正则表达式解析

p开头的正则表达式

思源笔记正则表达

用正则表达式限制文本框只能输入数字,小数点,英文字母,汉字等各类代 ...

Powerquery分离数字字母汉字

php+正则将字符串中的字母数字和中文分割

前端密码的正则表达式

vue 正则表达式 function 开头中文字母数字 (结尾

el-input 英文名称的正则

32个字符正则

四位英文和数字正则

字母正则匹配中文规则

8-14位字母、数字或符号组合正则

长度不小于4的正则表达式

最新文章

纯数字正则表达式

zipkin tagquery用法

1-4096的整数正则表达式

正则10-360之间的整数

验证整数的正则表达式

正则匹配整数

标签列表

688IT编程网

从网页采集图片,生成PPT文件

发表评论

推荐文章

mongodb中match多个条件

纯数字正则表达式

zipkin tagquery用法

excel匹配正则 -回复

re正则匹配之findall

热门文章

js 数值型 验证 正则

oracle模糊查询正则

符合ca91的社会信用代码的正则表达式

C#中使用正则表达式校验输入的是否为英文字母【转载自】

Java正则表达式验证至少6位表达式中至少包含数字大小写字母中的一种

强密码校验正则

hive正则表达式解析

p开头的正则表达式

思源笔记正则表达

用正则表达式限制文本框只能输入数字,小数点,英文字母,汉字等各类代 ...

Powerquery分离数字字母汉字

php+正则将字符串中的字母数字和中文分割

前端密码的正则表达式

vue 正则表达式 function 开头 中文字母数字 (结尾

el-input 英文名称的正则

32个字符正则

四位英文和数字 正则

字母正则匹配中文规则

8-14位字母、数字或符号组合正则

长度不小于4的正则表达式

最新文章

纯数字正则表达式

zipkin tagquery用法

1-4096的整数正则表达式

正则10-360之间的整数

验证整数的正则表达式

正则匹配整数

标签列表

js 数值型验证正则

vue 正则表达式 function 开头中文字母数字 (结尾

四位英文和数字正则