一次Python爬虫的修改,抓取淘宝MM照片

本修改为在原基础上的一次学习与优化,毕竟刚开始学习,故代码中注释有所保留,方便以后回顾与学习语法。

请先了解原来能实现的目标,在此不再赘述。

原文地址:Python爬虫实战四之抓取淘宝MM照片

感谢庆才哥的代码与思路。

本修改详情

  • 代码改写为python3.5运行,因为3.5版本语法与模块有所变更
  • 增加cookie验证解决跳转
  • 无法保存图片能够容错而不是停止运行
  • 其他细节修改

程序流程介绍

加上cookie与伪装浏览器后先保存所有详情页,因为cookie有过期时间,而保存所有图片太耗时,故先保存详情页面下来,再提取网址获取图片。也可以将提取出来的地址保存为文件再导入获取图片,另一个思路而已,皆可行。

代码部分

cookie获取方式

注意只取cookie部分复制,代码中把#去掉

一次Python爬虫的修改,抓取淘宝MM照片

实现效果

一次Python爬虫的修改,抓取淘宝MM照片一次Python爬虫的修改,抓取淘宝MM照片一次Python爬虫的修改,抓取淘宝MM照片一次Python爬虫的修改,抓取淘宝MM照片


刚开始学习,欢迎大家一块学习探讨啊。

转载请注明原作者,如果你觉得文章对你有帮助或启发,也可以来请我喝咖啡

点赞