请登录[¤ 阳光论坛 ¤]参与讨论


阳光宝宝
90

 □ 主题: 网页表格数据采集 助手
 □ 内容: 1楼

      搞网上信息采集工作,最头疼的便是从网页上一次次很枯燥地进行数据表格的复制,而且在复制过来之后还要进行很多修改,不但麻烦而且也很浪费时间,工作效率大打折扣。这时我们不妨用功能强大的Excel来试着解决一下问题。  
        对于比较规范的表格数据,我们完全可以在表格页面上点击右键,选择"导出到Microsoft Office Excel",此时系统会自动打开Office Excel,进行数据加载。这个过程仅需要几秒钟就把数据加载进来。如果你认为数据比较适合你的编辑要求,那么就可以直接保存了。 
       但是如果你要网页上的表格复制下来还是保存为文本格式,或者一次性同时采集某个网站上连续多个页面的网页表格,那一次次用EXCEL软件也还是显得有些麻烦,故此,本人最近开发设计了网页表格数据采集助手软件。 
        
       
       
      支持单元格数据链接的采集 
       
       
      支持仅采集指定的字段 
       
      试用版软件下载地址点击下载,仅538KB 
       
      软件淘宝网销售地址:点击进入我的淘宝网店
——
      
争分夺秒背单词 → international  a.国际的,世界(性)的
 □ 发帖时间:2013-5-8|16:21:27 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 2楼

      该软件可连续或定时不断的采集指定网站上前后关联的标准二维表,而且操作也非常简单方便。 
       
       网页表格数据采集步骤: 
       
       1、首先在地址栏输入待采集的网页地址 
       
       2、再点击抓取测试按钮,看看网页源码及该网页中所含的表格数量,网页源码在软件下面的文本框中显示,网页中所含的表格数及表头信息在软件左上角列表框中显示。 
       
       3、请从表格数列表中选择你要抓取的表格,此时表格左上角第一格文字将显示在软件的表格左上角第一格内容输入框中,表格所含字段(列)将显示在软件左侧的中间列表中。 
       
       4、请选择你要采集的表格数据的字段(列),如果不选择,将全部采集。 
       
       5、选择你是否要抓取表格的表头行,保存时是否显示表格线,如果网页表格中有字段有链接,你可以选择是否包含链接地址,如果有且要采集其链接地址,那么你不能同时选择包含表头行。 
       
       6、如果你要采集的表格数据只有一个网页,那么你现在就可直接点击抓取表格抓取了,如果前面不选择包含表格线,表格数据将以CVS格式保存,此格式可用微软EXCEL软件直接打开转为EXCEL表格,如果前面选择包含表格线,表格数据将以TXT格式保存,可用记事本软件打开查看,直接具有表格线,也很清晰。 
       
       7、如果你要采集的表格数据有连续多个页面,并且你都想将其采集下来,那么,请再设置程序采集下一页及后续页面的方式,可以是根据链接名打开下页,链接名称几乎大部分页面都是“下一页”,你看页面,找到后输入即可,如果网页没有下一页链接,但是网址中包含页数,那么你也可选择根据网址中的页数打开,你可以选择从前到后,如从1页到10页,也可选择从后到前,如从10页到1页,在页数输入框中输入即可,但此时网址中代表页数的位置要用“(*)”代替,否则程序将不认识。 
       
       8、最后你再选择是定时采集或等待网页打开并加载结束后立即采集,定时采集是程序根据一个设定的很小的时间间隔去判断打开的页面中是否有你要的表格,有就采集,而网页加载后采集是只要是要采集的网页已经打开了,程序就会立即进行采集,两者各有特色,看需要选择。 
       
       9、最后,就是你点击一下抓取表格按钮,然后你就泡杯咖啡逍遥去吧!
——
      
争分夺秒背单词 → extreme  a.极度的;尽头的
 □ 发帖时间:2013-5-8|16:22:25 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 3楼

      最新版本重写了程序内核代码,功能更加强大,运行更加稳定,并且支持一些复杂表格数据的采集了,比如包含行单元格合并的表,列单元格合并的表,甚至是行列单元格一起合并的表的数据的采集了,同时对于同一页面中,多个格式相同的表,也可使用相同关键字一起采集,还支持自定义常用网址了。
——
      
争分夺秒背单词 → football  n.足球比赛;足球
 □ 发帖时间:2013-5-16|16:29:11 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 4楼

      试用版软件下载地址点击下载,仅538KB
——
      
争分夺秒背单词 → doctor  n.医生,医师;博士
 □ 发帖时间:2013-5-29|11:01:49 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 5楼

      视频教程: 
      进入百度网盘下载
——
      
争分夺秒背单词 → till  prep.conj.直到…为止
 □ 发帖时间:2014-6-13|14:42:43 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 6楼

      软件淘宝网店购买地址: 
      点击进入我的网店sybxp.taobao.com
——
      
争分夺秒背单词 → specialize  vt.使专门化,专业化
 □ 发帖时间:2014-6-14|22:03:57 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 7楼

      定时采集方式下,鼠标左键点击状态栏第一格延迟,右键点加速,可多次点击延迟或加速,状态栏第二格第三格是用于查找编辑框中的文字的,第四格是预览当前采集的表格的
——
      
争分夺秒背单词 → energize  vt.给与…能量;电压
 □ 发帖时间:2014-9-12|21:58:34 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:网页表格数据采集 助手
 □ 内容: 8楼

      想知道如何使用本软件吗?请点击以下链接跟我来 
      转到操 
      作教程

——
      
争分夺秒背单词 → spirit  n.精神;气魄;情绪
 □ 发帖时间:2019-12-25|19:20:01 |回复|返回|

 页次:1/1页 每页10  本主题贴数7 分页: 1


你还没有登录论坛,所以不能发表你的意见。你可以选择:

1、我已注册,我要

2、我还没注册,我要

3、太麻烦了,我还是

Go Top

Copyright by(C)2003-2015 http://abc.sy578.cn