请登录[¤ 阳光论坛 ¤]参与讨论


阳光宝宝
90

 □ 主题: 网文采集大师 采集南方财富网K线信息文章视频教程
 □ 内容: 1楼

      视频下载地址在底部 
       
      看到要采集的文章,复制一段文字后,点击页面右键菜单中的文本采集菜单,弹出网文采集大师软件,软件打开后会自动显示当前使用的浏览器浏览的页面,就是你想采集的页面。 
       
      一、提取目录链接: 
       
       检查目录链接中各链接的共有属性,取共同部分设置为链接关键字,关键字支持通配符*、?和#,我们可以拖其中的一个链接到关键字输入框后再修改。 
       如果目录链接有多页,可输入下页链接名称,如本站的为“下一页”,也可选择后点击下页链接名输入框,程序会自动输入,这样设置好后就可点击执行命令按钮,选择“提取目录链接”提取各文章网址了,稍等片刻,我们看到程序已经为你提取了所有3页共92个链接了,通过目测检查,发现其中有3个链接是目录页网址,我们把它们选中后删除了,剩下的就是我们真正有用的链接了,就可删除链接关键字和下页链接名称了继续下一步了。 
       
      二、设置获取正文起始终止关键字: 
       
       打开提取到的第一个链接,就是点击第一个链接,再点击地址栏回车,打开第一个文章页面,开始设置文章正文采集关键字。我们先点击获取正文,测试一下,可以看到整个页面的文字都获取了,再看正文前后有什么固定的文字,每篇文章都有的,找到后再输入正文起始和终止关键字输入框中,找到关键字后输入(可在浏览页面中选定,再点击关键字输入框,让程序自动输入),输入后再点击获取文章看是否正确,然后再选择其它任何一个链接,打开,再测试一下,是否也能正常获取,如果可以的话,应该就没问题可以继续下一步了。 
       
      三、设置以什么名字保存文章文件名: 
       
       程序默认以网页标题为文件名,但网页标题中一般还包含网站名称等相关信息,我们不需要,在这个网站中,文章的标题后还带“-南方财富网”几个字,前面没有多余内容,因此,我们只要在保存文章前一个关键字输入框中输入“-”就行了,再选择要保存的目录,也可点击一个目录后新建一个目录,再点击保存文章按钮,测试一下是否可正常保存,如果可以的话,我们就可让程序进行自动批量采集了。 
       
      四、批量单页采集: 
       
       点击执行命令中的批量单页采集,就可坐等结果了,如果一次还没有采集结束,想留到下次打开电脑再采集的话,我们还可保存当前任务,下次就可打开已经保存的任务快速开始文章的采集了。 
       
       
      视频教程下载地址:
点击此处去百度云盘下载
——
      
争分夺秒背单词 → intent  a.目不转睛的,热切的
 □ 发帖时间:2014-5-11|18:16:23 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网文采集大师 采集南方财富网K线信息文章视频教程
 □ 内容: 2楼

      点此下载任务配置文件 
       
      解压到软件安装目录中即可,如果不想覆盖原来的任务的话,请打开sbject.ini,将里面的文字复制到原来的文件中另起一行就行了。
——
      
争分夺秒背单词 → geometrical  a.几何学的
 □ 发帖时间:2014-5-11|18:34:17 |回复|返回|

 页次:1/1页 每页10  本主题贴数1 分页: 1


你还没有登录论坛,所以不能发表你的意见。你可以选择:

1、我已注册,我要

2、我还没注册,我要

3、太麻烦了,我还是

Go Top

Copyright by(C)2003-2015 http://abc.sy578.cn