第一步,我们得先提取博主的文章目录链接,我们可以先复制不同位置的三个链接,这个博主文章发的多,光目录都有62页,我们尽量在不同页中复制这种链接,放在一起检查一下: http://blog.sina.com.cn/s/blog_69f9326d0102ycv7.html http://blog.sina.com.cn/s/blog_69f9326d0102ycrq.html http://blog.sina.com.cn/s/blog_69f9326d0102xqns.html 从中我们不难发现,他的所有文章的链接,前面一部分都是: http://blog.sina.com.cn/s/blog_69f9326d0102 好,我们就以链接中的这段字符作为关键字,在软件网址输入框右侧的过滤关键字中输入: http://blog.sina.com.cn/s/blog_69f9326d0102*.html 这里的*是通配符,可以代表1到多个任意字符,后面的.html是博文链接的扩展名,您不输入也可以,但是我们取关键字,就一定要取如数学中的多个数的最大公约数。 设置了过滤关键字,接下来再设置下一页链接关键字,看一下,链接页面的下一页链接就是下一页,我们直接在此输入框输入下一页即可,输入完,再点击执行命令,在弹出菜单中点击提取目录链接即可,程序就会开始自动连续不断去提取文章链接了,直到62页链接全部提取完毕。
|