温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

用python爬虫在知乎上提取图片的示例

发布时间:2020-11-23 09:59:46 来源:亿速云 阅读:208 作者:小新 栏目:编程语言

这篇文章主要介绍用python爬虫在知乎上提取图片的示例,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

下面的代码注释请仔细阅读,中间有一个小BUG,需要手动把pic3修改为pic2这个地方目前原因不明确,可能是我本地网络的原因,还有请在项目根目录先创建一个 imgs 的文件夹,用来存储图片

def download_img(self,data):         ## 下载图片         for item in data["data"]:             content = item["content"]             pattern = re.compile('<noscript>(.*?)</noscript>')             imgs = pattern.findall(content)             if len(imgs) > 0:                 for img in imgs:                     match = re.search('<img src="(.*?)"', img)                     download = match.groups()[0]                     download = download.replace("pic3", "pic2")  # 小BUG,pic3的下载不到                     print("正在下载{}".format(download), end="")                     try:                         with requests.Session() as s:                             with s.get(download) as img_down:                                 # 获取文件名称                                 file = download[download.rindex("/") + 1:]                                 content = img_down.content                                 with open("imgs/{}".format(file), "wb+") as f:  # 这个地方进行了硬编码                                     f.write(content)                                 print("图片下载完成", end="\n")                     except Exception as e:                         print(e.args)             else:                 Pass

运行结果为

用python爬虫在知乎上提取图片的示例

 

以上是用python爬虫在知乎上提取图片的示例的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注亿速云行业资讯频道!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI