Python多线程Threading爬取图片，保存本地

winmeanyoung

2020-05-05

注意：之前用过openpyxl库保存数据到Excel文件写入不了，换用xlsxwriter

import os
import requests
import re
from openpyxl import load_workbook
import xlsxwriter
from multiprocessing.dummy import Pool as ThreadPool

def spider(url):
    headers = {
        ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.132 Safari/537.36‘}
    html = requests.get(url, headers, timeout=None)
    pic_url = re.findall(‘class="product-image">.*?<img src="(.*?)"  height="‘, html.text, re.S)
    sku = re.findall(‘q=(\d+)‘, url, re.S)#正则匹配链接后面的sku
    if pic_url != []:
        print(‘正在下载‘+sku[0]+‘图片，图片地址：‘ + pic_url[0])
        pic = requests.get(pic_url[0])
        dir = cwd + ‘\\images\\‘ + sku[0] + ‘.jpg‘
        # print(dir)
        with open(dir, ‘wb‘) as file:
            file.write(pic.content)
    else:
        if sku !=[]:
            print(‘没有找到‘ + sku[0]+‘产品‘)
            No_images.append(sku[0])
#之前用过openpyxl创建新的Excel文件，但是写入不了，之后换用xlsxwriter保存数据到Excel
def save_excel(sku):
    print(sku)
    wb1 = xlsxwriter.Workbook(cwd + ‘\\‘ + ‘No_images.xlsx‘)
    ws1 = wb1.add_worksheet()
    ws1.write(0, 0, ‘No_images_sku‘)
    for i in range(1,len(sku)+1):
        ws1.write(i, 0, sku[i-1])
    wb1.close()
    print(‘保存没有图片的sku成功！‘)

if __name__ == ‘__main__‘:
    cwd=os.getcwd()
    path = cwd + ‘\\‘+‘最近12个月没有销量产品（201711）.xlsx‘
    wb =load_workbook(path)
    ws = wb.worksheets[0]
    pool =ThreadPool(50)#开启多少个进程，四核电脑
    urls = []
    No_images = []
    for i in range(1, ws.max_row+1):#通过循环将Excel数据读取出来
        sku = ws.cell(i,2).value
        if sku !=None:
            print(‘正在爬取第‘+str(i)+‘个sku图片‘)
            url = ‘http://www.fulchic.com/catalogsearch/result/?q=‘ + str(sku)
            urls.append(url)
    pool.map(spider,urls)#多线程工作，其中，spider是爬虫函数名，urls是个爬取链接列表
    pool.close()
    pool.join()
    # print(No_images)
    save_excel(No_images)

xlsxwriter python

winmeanyoung

0 关注 0 粉丝 0 动态

相关推荐

Python操作excel

Python对Excel的读写主要有xlrd、xlwt、xlutils、openpyxl、xlsxwriter几种。　　 print sheet_name rows = sheet2.row_values # 获取第四行内容。　　 cols = sheet

up0 2020-06-13

使用 Python 合并多个格式一致的 Excel 文件

最近朋友在工作中遇到这样一个问题，她每天都要处理如下一批 Excel 表格：每个表格的都只有一个 sheet，表格的前两行为表格标题及表头，表格的最后一行是相关人员签字。最终目标是将每个表格的内容合并到一个 Excel 表格中，使之成为一张表格。在她未咨询

sschencn 2019-12-27

Python使用pandas和xlsxwriter读写xlsx文件的方法示例

df = pd.read_excel #读取xlsx中第一个sheet. data5 = df.ix[:,[u'class',u'name']].values #读取指定键值列的所有行。print # 获取xlsx文件的所有行号

三石 2019-04-09

python 让挑选家具更方便（内附python教程分享）

总共8页的数据，第一页的网址里 sell/list-66.html，第二页的sell/list-66-2.html，所以sell/list-66-1.html也就是第一页数据了，这样就更方便遍历网址来获取数据了。同时这里使用BeautifulSoup解析数

HMHYY 2019-03-17

扣丁学堂Python培训告诉你Python中XlsxWriter模块简介与用法

XlsxWriter，可以生成excel文件，然后很重要的一点就是，它不仅仅只是生成数据，还能插入直方图，饼图…，使用条件格式，合并单元格等等这些操作。我们以下图为例，来和大家分享一下。chart1 = workbook.add_chart#选择直方图

一叶不知秋 2018-12-18

Python合并多个Excel数据的方法

Excel是由行和列组成的，所以这里将所有文件中的所有sheet中的数据读取出来组成一个二维数组，然后再写入新的Excel. 刚开始学习Python，可能是由于看惯了Java代码的缘故吧，初学起来感觉语法怪怪的，跟Java有些类似，又感觉和JavaScri

wangyaqi 2018-07-16

python xlsxwriter创建excel图表的方法

本文实例为大家分享了python xlsxwriter创建excel图表的具体代码，供大家参考，具体内容如。# 配置series,这个和前面worksheet是有关系的。

elizabethxxy 2018-06-11

python操作excel的包(openpyxl、xlsxwriter)

本文为大家分享了python操作excel的包，供大家参考，具体内容如下。官网上最推荐的是openpyxl，其他包支持较老的excel版本。xlsxwriter无法对打开的excel进行写操作，excel必须处于关闭状态才能写成功。#python 类型数据

linkequa 2018-06-11

对python中的xlsxwriter库简单分析

output_file = u"D:\\python和shell脚本\\10969的代码\\test.xlsx". wb.close()二、xlsxwriter 格式处理，将待添加数据转换成相应的格式，添加到 xlsx 文件中

fanhuasijin 2018-05-04

python XlsxWriter模块创建aexcel表格的实例讲解

安装使用pip install XlsxWriter来安装,Xlsxwriter用来创建excel表格,功能很强大,下面具体介绍:. worksheet.write #在A2上写上WORLD,并且设置为加粗。worksheet.write #使用行列的时候

wwzhang00 2018-05-03

windows下安装Python的XlsxWriter模块方法

在windows环境下安装python的XlsxWriter模块，虽然很简单，但由于自己粗心，少了一个字符，导致不少的错误。。。You should consider upgrading via the 'python -m pip install --u

小海 2018-05-03

python调用xlsxwriter创建xlsx的方法

第二级则是描述是否有连线，是否有平滑曲线等细节调整。filled下面举例绘制一个散点图。

houmenghu 2018-05-03

Python向Excel中插入图片的简单实现方法

本文实例讲述了Python向Excel中插入图片的简单实现方法。分享给大家供大家参考，具体如下：。使用Python向Excel文件中插入图片，这个功能之前学习xlwt的时候通过xlwt模块实现过。那时候是在公司做的尝试，印象中插入的图片最终缩小为了一个单元

CandyGL 2018-04-24

Python中XlsxWriter模块简介与用法分析

本文实例讲述了Python中XlsxWriter模块用法。分享给大家供大家参考，具体如下：。XlsxWriter，可以生成excel文件，然后很重要的一点就是，它不仅仅只是生成数据，还能插入直方图，饼图….，使用条件格式，合并单元格等等这些操作。话不多说，

liusarazhang 2018-04-24

python实现数据写入excel表格

建立Chart对象： chart = workbook.add_chart. # categories：是x轴项，也就是类别；# values:是y轴项，也就是值；

木心 2018-03-25

python xlsxwriter库生成图表的应用示例

xlsxwriter可能用过的人并不是很多，不过使用后就会感觉，他的功能让你叹服，除了可以按要求生成你所需要的excel外。还可以加上很形象的各种图，比如柱状图、饼图、折线图等。这里包含了数据公式的计算，插入图片的连接，生成的图表，当然如果你还需要其他的功

jibkfv 2018-03-16

Python数据报表之Excel操作模块用法分析

本文实例讲述了Python数据报表之Excel操作模块用法。分享给大家供大家参考，具体如下：。Excel是当今最流行的电子表格处理软件，支持丰富的计算函数及图表，在系统运营方面广泛用于运营数据报表，比如业务质量、资源利用、安全扫描等报表，同时也是应用系统常

cassiePython 2019-03-11

Python实现定制自动化业务流量报表周报功能【XlsxWriter模块】

本文实例讲述了Python实现定制自动化业务流量报表周报功能。分享给大家供大家参考，具体如下：。本次实践通过定制网站5个频道的流量报表周报，通过XlsxWriter 模块将流量数据写入Excel文档，同时自动计算各频道周平均流量，再生成数据图表。更多关于P

pythoncream 2019-03-11

python使用xlsxwriter实现有向无环图到Excel的转换

def generate_excel:#参数分别为有向无环图图、开始写入的行,开始写入列，以及文件名。def get_node_leaves:#用来返回一个节点的所有最终叶子结点。node_leaves = len#获取所有叶子的个数，用来判断是否进行合并

admans 2018-12-12

利用PHP_XLSXWriter代替PHPExcel的方法示例

本文主要给大家介绍的是关于利用PHP_XLSXWriter代替PHPExcel的方法，分享出来供大家参考学习，下面话不多说，来一起看看详细的介绍：。PHPExcel 是一个处理Excel,CVS文件的开源框架,它基于微软的OpenXML标准和PHP语言。相

PHP100 2019-03-28

winmeanyoung

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号