视频下载地址在底部 看到要采集的文章,复制一段文字后,点击页面右键菜单中的文本采集菜单,弹出网文采集大师软件,软件打开后会自动显示当前使用的浏览器浏览的页面,就是你想采集的页面。 一、提取目录链接: 检查目录链接中各链接的共有属性,取共同部分设置为链接关键字,关键字支持通配符*、?和#,我们可以拖其中的一个链接到关键字输入框后再修改。 如果目录链接有多页,可输入下页链接名称,如本站的为“下一页”,也可选择后点击下页链接名输入框,程序会自动输入,这样设置好后就可点击执行命令按钮,选择“提取目录链接”提取各文章网址了,稍等片刻,我们看到程序已经为你提取了所有3页共92个链接了,通过目测检查,发现其中有3个链接是目录页网址,我们把它们选中后删除了,剩下的就是我们真正有用的链接了,就可删除链接关键字和下页链接名称了继续下一步了。 二、设置获取正文起始终止关键字: 打开提取到的第一个链接,就是点击第一个链接,再点击地址栏回车,打开第一个文章页面,开始设置文章正文采集关键字。我们先点击获取正文,测试一下,可以看到整个页面的文字都获取了,再看正文前后有什么固定的文字,每篇文章都有的,找到后再输入正文起始和终止关键字输入框中,找到关键字后输入(可在浏览页面中选定,再点击关键字输入框,让程序自动输入),输入后再点击获取文章看是否正确,然后再选择其它任何一个链接,打开,再测试一下,是否也能正常获取,如果可以的话,应该就没问题可以继续下一步了。 三、设置以什么名字保存文章文件名: 程序默认以网页标题为文件名,但网页标题中一般还包含网站名称等相关信息,我们不需要,在这个网站中,文章的标题后还带“-南方财富网”几个字,前面没有多余内容,因此,我们只要在保存文章前一个关键字输入框中输入“-”就行了,再选择要保存的目录,也可点击一个目录后新建一个目录,再点击保存文章按钮,测试一下是否可正常保存,如果可以的话,我们就可让程序进行自动批量采集了。 四、批量单页采集: 点击执行命令中的批量单页采集,就可坐等结果了,如果一次还没有采集结束,想留到下次打开电脑再采集的话,我们还可保存当前任务,下次就可打开已经保存的任务快速开始文章的采集了。 视频教程下载地址:点击此处去百度云盘下载
|