火车采集器V7正式版下载7.6 免费版

优采云 发布时间: 2020-05-21 08:00

  

  9、处理了一个将$编码错误的问题;

  10、增加若干个错误检测火车采集器7.6破解版,防止采集器退出;

  11、更换汉字转拼音词库,汉字降低到1万8;

  12、更新手动补全链接中迅雷地址补全不对的问题。

  火车头采集平台定义了统一的插口规范并提供了大量的api,用户可以很方便的开发自己的应用并在该平台上运行,可以降低开发上时间和成本。目前平台上有官方自带列车采集器。

  此软件版本为列车采集器v7.7红色正式版,软件下载后直接解压即可。注意:软件运行时,要有.net2.0框架,vista及win7系统用户可能会提示恳求管理员权限,请放行。如果没有请下载!

  安装说明★★

  火车头数据采集平台要求:您的笔记本必须安装.net framework2.0或2.0以上框架.如果您的采集器打不开,请下载并安装该框架

  附windows .net framework 2.0

  32位下载地址:

  64位下载地址:

  若要从3.2sp5,2008,2009或2010版直接升级到火车头数据采集平台最新版,请运行程序目录下的 UpdateToV7.exe,按提示进行升级。升级程序不会对原先的数据进行任何的更改,但为了避免用户误操作,请在升级前备份旧版本数据和配置。备份方式是将原采集器完整复制一份。

  1.采集规则

  简称规则火车采集器7.6破解版,V7先前版本采集规则分为站点规则和任务规则,通常是指任务规则。V7版及之后采用无限级分组管理任务规则,所以不再有站点规则的概念。所谓采集规则就是要采集一个网站或某一网站栏目网页须要在软件里进行的设置。这个设置可以从软件里导入保存成一个文件并可以再导出到软件里。V7版的任务规则文件后缀名为.ljobx,以前的站点规则文件的后缀名为:.lsite;任务规则文件的后缀名为:.ljob。

  2.采集任务

  采集任务又简称为任务。它是采集规则和发布规则的总和。也是采集规则和发布规则的载体。采集规则和发布规则的设置通过在任务编辑框里进行设置。从采集器里导入的采集规则文件(.ljobx后缀的)也可称为任务规则。导入导入任务规则就是指导出导入.ljobx文件。

  3.发布模块

  发布模块又称模块、发布规则,分为WEB发布模块和数据库发布模块。所谓发布模块就是在须要将早已采集的数据发布到目的地(比如:网站/后台中或指定数据库中)时在软件里进行的设置。这个设置可以保存成一个文件并可以导出到采集器里使用。数据库发布模块文件的后缀名为:.dpm;WEB在线发布模块文件的后缀名为:.wpm。(采集规则和发布模块都可以从采集器里导入,也都可以导出到采集器中使用。采集规则负责将网页上的数据采集下来,发布模块负责将采集的数据发布到网站中。可见,采集规则的编撰和更改和被采集的网站有关系,而发布模块的编撰和更改和要发布数据的网站有关系。如从不同的网站栏目采集数据往同一个网站的某个蓝筹股(频道)里发布,需要多个采集规则和一个发布模块。从一个网站栏目采集数据往不同的网站系统里发布,需要一个采集规则和多个发布模块。注意这儿的说的采集规则是指采集网站和抓取内容的设置。)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线