请登录[¤ 阳光论坛 ¤]参与讨论


阳光宝宝
90

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 11楼

      现答复你的几个问题: 
      1、保存任务功能以后将计划完善为列表方式,打开可选择,方便一些,现在只能保存一个任务。 
       
      2、标题关键字是文本文件保存时的关键字,这个地方很灵活,可以什么都不输入,这种情况一般是文章首行是本章或节的标题或该文经过自动排版后的首行是本章或节的标题,如果只输入标题结束关键字,将会取该文在标题结束关键字前的文字作为标题,有很多网络文章,它的首行并不完全是标题,但在首行某个字符前的文字就是标题时,可用这个办法,如果首行某个字符后,另一个字符前的是标题,那么起始关键字和结束关键字就都要输入了,如果你抓取的或输入的要采集的文章列表关键字是以序号形式出现的,比如全部是: 
      http://abc.sy578.cn/bbs/list.asp?page=001 
      http://abc.sy578.cn/bbs/list.asp?page=002 
      http://abc.sy578.cn/bbs/list.asp?page=003 
      ...... 
      那么,你如果标题起始关键字和结束关键字都不输入的话,还可能以001.txt、002.txt、003.txt形式保存,另外你还可以用鼠标右键点击批量抓取按钮,选择以序号文件名保存选项的,如果你要前缀的话,可在文件列表的快捷菜单中选择文件批量改名来完成。 
       
      3、正文起始和结束关键字有时需要输入,有时不用输入,你可以根据实际情况使用,这些关键字,有时是不用输入的,你只要在一篇例文中选定关键字,再点击输入框,它会自动上屏的,不过,如果技术成熟,对于某些网站,是可以让软件自动确定的,现在还要思考中。 
       
      4、各个窗口可以自由调整大小,这个软件其实我在最初考虑的就是这个问题,甚至还咨询过一些网友,以后肯定会考虑改成这样的。 
       
      5、现在的合并文件是要保存到一个新目录的,但你提的这个要求要实现起来并不难,我考虑考虑。 
       
      6、这个问题估计不大。 
       
      7、悬浮窗的功能目前还是弱了一点,资料收集大师软件我没用过,有空我下载一个参考学习一下。 
       
      感谢您列出了这么多宝贵的意见和建议,如你在使用中还有其它新的创意或建设,欢迎继续在此发贴,我会尽快答复的。
——
      
争分夺秒背单词 → obstacle  n.障碍,障碍物,妨害
 □ 发帖时间:2009-7-16|22:27:32 |回复|返回|



billdon
5

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 12楼

      不客气,其实还有些想法,比如将采集的资料分类,变成数据库。
争分夺秒背单词 → plural  a.复数的 n.复数
 □ 发帖时间:2009-7-18|8:45:30 |回复|返回|



billdon
5

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 13楼

      资料收集大师的下载网址http://www.mycnknow.com/indexcn.html
争分夺秒背单词 → trade  n.贸易;职业 vi.交易
 □ 发帖时间:2009-7-18|8:49:35 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 14楼

      将采集的资料收集到一个资料库,这样的功能也是我想要增加的,比如在我的另一款软件汉语之星中,就有将网上的或其它地方的资料收到资料库中的功能。 
       
      我会下载一个资料收集大师看看的,谢谢
——
      
争分夺秒背单词 → volt  n.伏特,伏
 □ 发帖时间:2009-7-18|17:32:31 |回复|返回|



billdon
5

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 15楼

      安装了汉语之星,功能还不错!但是数据的编辑功能不强,用户无法按自己的需要添加数据。例如,英汉词典的词汇有限,用户如何根据分类,批量导入? 
       
      其实我使用网文采集大师主要是收集一些词汇、例句和文章。希望资料收集后,对它们进行编辑、分类并做成自定义词库、句库,便于查询。 
       
      另外,在网文采集大师收集结果位置最好有编辑窗口,将轻松文本的某些功能加入
争分夺秒背单词 → crack  vi.&vt.发出爆裂声
 □ 发帖时间:2009-7-19|11:25:32 |回复|返回|



billdon
5

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 16楼

      l另外,有多种格式 
       
      第1种: 
        Climbing the walls to fitness: Climbing gyms see surge in popularity  
        攀岩健身:攀岩健身房日渐走红  
        Tired of climbing on the step machine but never actually getting anywhere?  
        厌倦了站在原地登阶机吗?  
       
      第2种: 
          Climbing the walls to fitness: Climbing gyms see surge in popularity 攀岩健身:攀岩健身房日渐走红  
        Tired of climbing on the step machine but never actually getting anywhere? 厌倦了站在原地登阶机吗?  
      第3种:  
        Climbing the walls to fitness: Climbing gyms see surge in popularity  
          Tired of climbing on the step machine but never actually getting anywhere?  
        攀岩健身:攀岩健身房日渐走红  
       厌倦了站在原地登阶机吗? 
      ==================================  
      根据以上三种格式,怎样才能自动收集到数据库中,字段分别是英文,中文,分类? 
      
争分夺秒背单词 → logical  a.逻辑的;符合逻辑的
 □ 发帖时间:2009-7-19|12:17:04 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 17楼

      呵呵,你的要求比较特殊,像上面的要求只能通过编程实现
——
      
争分夺秒背单词 → generalization  n.一般化;概括,综合
 □ 发帖时间:2009-7-19|21:21:03 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 18楼

      我的QQ是:82126187,在网站首页和软件帮助说明中都有的,可以加我,共同讨论!
——
      
争分夺秒背单词 → absent  a.不在意的
 □ 发帖时间:2009-7-19|21:21:45 |回复|返回|



billdon
5

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 19楼

      像这样的文章,网文采集大师好像不行无
争分夺秒背单词 → slave  vi.作苦工 vt.奴役
 □ 发帖时间:2009-7-24|10:28:56 |回复|返回|



阳光宝宝
90

 □ 主题: 回应:关于网文采集大师的几个问题?
 □ 内容: 20楼

      你是指中英对照,全部要采集吗?
——
      
争分夺秒背单词 → set  n.集(合)
 □ 发帖时间:2009-7-24|11:13:02 |回复|返回|

 页次:2/5页 每页10  本主题贴数40 分页: 1 2 3 4 5


你还没有登录论坛,所以不能发表你的意见。你可以选择:

1、我已注册,我要

2、我还没注册,我要

3、太麻烦了,我还是

Go Top

Copyright by(C)2003-2015 http://abc.sy578.cn