虎扑相册下载脚本使用指南

一个简单的python脚本

###原理 抓取提供的相册url地址,正则表达式匹配或生成出需要的页面信息,如相册标题和相册所有的页面地址,然后抓取相册所有页面的内容并匹配出相册的图片url,并转换成大图地址。本脚本会在所处路径生成与要下载的相册同名的文件夹,所有的图片url会写入此文件夹下的urls文件中,然后调用系统中的wget软件来下载所有的图片。(没有wget也没有关系,可以复制urls文件中的内容用其他的下载软件下载。)

###运行环境

###使用方法 注意:相册的url为个人相册页面中的单个相册地址。
like this:

  • http://my.hupu.com/ariesbuji/photo/a195704.html
  • http://my.hupu.com/ariesbuji/photo/a195704.html

把要下载的相册页面url作为本脚本的参数运行。
>: python hupu_Album.py http://my.hupu.com/jzgk/photo/a75782-1.html
(也可直接修改脚本内的url为要下载的相册url,直接运行)

####windows用户配置python环境
(如果你安装过java环境,是一回事) 先到www.python.org下载安装包。版本2.7.3即可;

默认安装即可(python会安装到系统盘 C:\python27 ) 接下来配置一下环境变量就ok了;
右键-我的电脑»>属性»>高级»>环境变量系统变量中找到path变量;双击添加变量值,添加进你的python安装路径,默认是C:\python27,并以;结尾。搞定!

验证配置是否成功:

  • 运行cmd: win + R输入cmd 运行
  • 输入python回车 能够进入python解释器界面就算成功

####windows用户安装wget WGET for Windows到此页面下载 wget.exe 将下载下来的wget.exe放到目录c:\windows\sytem32下 进入命令行: 运行>cmd>wget -h 验证是否安装成功

Tag:pythonscript Published under (CC) BY-NC-SA
comments powered by Disqus