全新产品:优采云采集器V7正式版

优采云 发布时间: 2020-11-17 13:02

  优采云采集器V7正式版

  25、Mongodb数据库保存数据

  26、主从服务器分布式采集

  更新日志

  优采云采集器v7.6绿色正式版更新列表:

  1、gif图片不再加水印,修复添加水印文本时无法判断水印条件的问题;

  2、增加了迅雷上传,YunFile,干脑,金山网盘的文件上传功能;

  3、添加了选项,供用户选择在删除记录时是否删除下载的文件;

  4、通过上传文件功能添加了日志记录;

  5、添加了将数据批量导入URL的功能;

  6、在发布时添加了代理功能;

  7、修复了使用一般的单发方法时另存为本地excel的错误;

  8、文件保存格式支持[tag:ID],并且记录的ID可以用作目录的一部分;

  9、处理了$编码错误的问题;

  10、添加了一些错误检查,以防止采集器退出;

  11、将汉字替换为拼音字典,汉字增加到18,000;

  1 2、更新了自动完成链接中不正确的Xunlei地址完成问题。

  软件安装说明:

  优采云采集该平台定义了统一的接口规范,并提供了大量的API。用户可以轻松地开发自己的应用程序并在平台上运行它们,这可以减少开发时间和成本。目前,官方平台随附优采云采集器。

  此软件版本为优采云采集器v7.7绿色正式版,下载后直接将其解压缩即可。注意:软件运行时,必须有一个.net2.0框架。 Vista和win7系统用户可能会被提示请求管理员权限,请让他们离开。如果没有,请下载!

  安装说明★★

  优采云Data 采集平台要求:您的计算机必须安装.net Framework2.0或2.0或更高版本的框架。如果您的采集器无法打开,请下载并安装框架

  使用Windows .net框架2.0

  32位下载地址:

  64位下载地址:

  升级说明

  要直接从3.2sp5、2008、2009或2010版本升级到优采云data 采集平台的最新版本,请在程序目录中运行UpdateToV7.exe并按照提示进行升级。升级程序不会对原创数据进行任何更改,但是为了防止用户误操作,请在升级之前备份旧版本的数据和配置。备份方法是制作原创采集器的完整副本。

  采集相关条款

  1.采集规则

  V7 采集的早期版本中称为规则的规则分为站点规则和任务规则,通常指任务规则。 V7版本和更高版本采用无限的组管理任务规则,因此不再存在站点规则的概念。所谓采集规则是为了采集,需要在软件中设置网站或某个网站列页面。可以从软件导出此设置,将其保存为文件,然后导入到软件中。 V7中任务规则文件的后缀为.ljobx,前一个站点规则文件的后缀为.lsite;任务规则文件的后缀是.ljob。

  2.采集任务

  采集任务也简称为任务。它是采集规则和发布规则的总和。它也是采集规则和发布规则的载体。 采集规则和发布规则在任务编辑框中设置。从采集器导出的采集规则文件(.ljobx后缀)也可以称为任务规则。导入和导出任务规则将指导导入和导出.ljobx文件。

  3.释放模块

  发布模块也称为模块和发布规则,分为WEB发布模块和数据库发布模块。所谓的发布模块是软件中的设置,当需要将采集的数据发布到目标位置时(例如:网站 /在后台或在指定的数据库中)。此设置可以保存为文件,也可以导入采集器中使用。数据库发布模块文件的后缀为.dpm; WEB在线发布模块文件的后缀是.wpm。 (采集规则和发布模块可以从采集器导出,也可以导入到采集器中使用。采集规则负责网页采集上的数据向下,发布模块是负责采集的数据发布到网站,可以看出采集规则的编写和修改与采集的网站相关,发布模块的编写和修改也相关例如,要将数据从不同的网站列采集发布到相同网站的某个部分(通道),则需要多个采集规则和一个发布模块从网站列采集数据到在不同网站系统中发布需要一个采集规则和多个发布模块,请注意,此处提到的采集规则是指采集 网站和要捕获的内容。)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线