python处理excel链接_Python处理Excel⽂件实例代码
由于⼯作需要,需要检查是否⼀个查询的⼀部分内容是有效的。查询存储在Excel中,⽂本内容页⾯的标题,和页⾯的URL格式中的每个细胞的
超链接。所以我本能地想到使⽤Python来读取Excel⽂件并执⾏⽂本分析,然后为每个链接时,执⾏⼀个HttpRequest和确定当前链接是否有
效的通过分析HttpResponse的内容。所以我搜索互联⽹,发现更多的主流是xlrd的插件,但在实际使⽤中,我发现在任何情况
下,hyperlink_map最终获得的价值总是没有,并没有时间去分析原因。最后,搜索之后,我发现了⼀个叫做xlwings Python库,可以有效地使
⽤。具体代码如下:# - * -编码utf - 8 = - *进⼝xlwings作为xwimport urllibimport systype = () def get_html (url):页⾯= (url) html =
()返回解压(html) # #调试我发现,不管你怎么做解码,最终结果是混乱的# #之后,发现相应的⽹页被压缩,因此您需要⼿动解压获得⽹页内容
python怎么读取桌面上的文件
def解压(数据):导⼊gzipimport StringIOdata =(数据)⼴州= (fileobj =数据)数据=()()返回datawb = (r\u201CC: \\⽤户桌⾯\\ \\神⾈
\\\u201D)main_data = (\u201CSheet2\u201D) # #确定有效获取当前表的最后⼀⾏细胞数和列数rownum = main_ (A1)。
current__ # #定位列对应列col_dict =
{\u201C2\u201D:\u201CB\u201D,\u201C3\u201D:\u201CC\u201D,\u201C4\u201D:\u201CD\u201D,\u201C5\u201D:\u20的⾏范围(1,rownum + 1):坳的范围(2,colnum + 1):查询= main_(⾏,1)。坳valuecell = main_(⾏)html链接= = get_html(链接)如果
\u201Cerror-container\u201D在html:打印\u201C% s, % s % s %(查询,col_ (str (col)) + str(⾏))# #颜⾊⽆效链接所属细胞和直接
写⽂件= (253218 4)

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。