无人看管的免费自动采集器v3.4.6绿色版本

优采云 发布时间: 2020-08-08 00:35

  无人看管的免费自动采集器是可以自动采集信息的软件. 无需手动操作,该软件也可以称为ET. 该软件会在24小时内自动完成采集工作,即使是年度设备也可以运行很长时间. 此外,该软件不需要繁琐的安装步骤,并且支持查看采集目录和采集的文章. 一般的操作流程是制定计划->配置采集规则以从目标中获取信息->配置中间规则->配置违规行为以发送信息添加到您的网站->自动开始工作,操作简单,只需遵循软件提示完成. 目前该软件支持Windows XP简体中文版,Windows 2000简体中文版,Windows 2003简体中文版,Windows Vista简体中文版;对于其他语言环境中的Windows系统,可以使用其中的一些,用户可以自己尝试,开发人员没有提供相应的技术支持,用户可以选择下载.

  

  软件功能

  设置劫持功能代码

  许多地区的电信宽带用户在上网时将被迫访问信息,用一些代码替换访问信息,以便用户只能通过代码中的框架查看他们最初想要访问的网页. 通常用于显示电信. 此行为称为劫持浏览器. 发生这种情况时,ET采集的源代码只能获取被劫持的代码,而不能获取要采集的网页的源代码. 通过设置这些劫持代码的特征字符串,ET将尝试突破劫持来访问真实的Web源代码,并且最多可以重试5次以访问网站.

  

  设置UserAgent

  网站使用userAgent来确定当前用户正在使用的浏览器,并根据该浏览器可以支持的情况提供相应的功能. 当浏览器访问网页时,通常会发送一个标识字符串来告诉网站它是什么浏览器软件. 我们访问的某些网站将限制UserAgent. 我们可以在基本设置中修改UserAgent,或者单击“获取此计算机”. UserAgent按钮获取本地IE默认的UserAgent.

  

  自动工作

  选择要执行的工作计划后,单击主窗口左下方的自动按钮以开始全自动工作. 从那时起,用户可以扔掉鼠标和键盘,放下烦人的网站更新,并和朋友一起出去玩. Traveling,网站内容具有自己的ET,可以为您静默采集更新.

  处理文章

  在商品列表区域中有要处理的商品时,单击主窗口左下方的“处理商品”按钮,将按顺序采集在商品列表区域中要处理的第一条商品. 在文章列表区域中双击,无论该文章是否已处理,都将为该文章采集一个文章条目.

  工作记录

  此列记录ET的每个步骤的工作过程和状态,包括两部分: 目录采集和文章处理. 通过工作记录,我们可以知道采集是否正确完成或发生了什么问题;当出现问题时,根据提示,结合信息栏中的其他反馈内容,用户可以快速,准确地找到故障原因并解决.

  采集源代码

  此列显示执行期间采集的文章列表页面,文章页面,文章分页等的源代码. 此列的源代码可用于促进规则测试,并为规则定制提供基础.

  分析数据

  此列显示文章处理中每个数据项的信息,从分析的原创代码到排序的代码,再到URL校正后的代码,用户可以通过查看此列来了解设置的数据项. 规则是否正确,归类组规则是否完整以及最终信息是否满足您的要求. 例如: 当工作记录列提示错误“正数大于或小于发布设置”时,我们可以检查此列中的“正文”数据项以了解其是否大于或小于是否是发布设置,无论是正常原因还是组织组设置不正确. 要调整每个设置.

  发送代码

  此列显示ET发送到发布网站的数据,包括文章审阅部分和文章发布部分;用户可以使用此列中的信息通过一系列分析和排序操作来了解最终提交给发布网站的数据,以检查自己采集规则的数据项和发布规则的参数设置是否正确和完整.

  退货信息

  此列显示了ET将数据发送到发布网站后网站的反馈,包括文章评论反馈和文章发布反馈;通过查看此列,我们可以清楚地了解采集过程中出现问题的大多数原因. 当某些接口返回错误信息时,该信息可能是HTML代码. 不熟悉HTML代码的用户很难阅读. 单击WEB浏览按钮可在操作系统的默认浏览器中方便地查看它们.

  步骤标记

  单击[Step]按钮将标记插入规则或将所选字符串替换为标记. 标记代码是一个可选项目,代表URL中定期更改的数字字符串. [step]标签可以在自动列表网址规则中使用,并且可以多次使用

  子循环标签

  单击[子循环]按钮以将标记插入规则或将所选字符串替换为标记. 标记代码是可选的,它表示在URL中定期更改的数字字符串. [Step]标记每个步骤,[Sub-loop]标记一个循环,即嵌套循环;当只有一个自动列表规则时使用[sub-loop]标签时,它等效于[step]标签; [sub-loop]标签在自动列表URL规则中只能使用一次.

  软件功能

  该软件没有第三方恶意插件,病毒*敏*感*词*木马和其他对计算机有害的信息

  支持无人值守,自动完成采集操作

  自动操作时间长,24小时不间断采集工作

  该软件具有良好的稳定性和性能,在没有特殊情况下不会被丢弃.

  下载文件和文章的速度很快

  支持伪原创功能,您可以将别人的东西转换成自己的东西

  可以支持将任何信息采集到软件中

  支持导出或导入信息

  安装方法

  不需要安装此软件. 找到下载的压缩包并解压缩,然后双击“ 优采云采集器 3.exe”应用程序以进入软件界面.

  

  使用方法

  从列表中采集缩略图

  1. 在系统导航栏中找到集合配置功能,单击进入相关界面,然后在选择列表中进行设置.

  

  2. 找到列表分析规则后,单击页面地址,然后选择缩略图. 添加后,您将获得如图所示的代码.

  

  3. 然后在[缩略图数据项]中设置其相关参数. 请注意,当[缩略图数据项]中的采集规则留为空白时,数据项的值就是[缩略图标记]的采集结果.

  

  4. 将鼠标滑动到页面底部,因为我们采集的缩略图通常是图片的地址,因此请选中“文件”选项中的“ [作为文件URL]”.

  

  5. 单击要下载的文件,然后在启用下载之前勾选选项框.

  

  6. 最后,必须使用发布配置的发布项目窗口中的数据项标记来分配网站的缩略图参数才能生效.

  

  7. ET3支持多层列表. 在多层列表中使用[缩略图标记],最后一次使用[缩略图标记]的采集结果将用作[缩略图数据项]的值.

  

  常见问题

  同名标签在ET3多层列表中的用法

  在新的ET3多层列表中,每个列表页面的列表分析规则具有相同的名称,可以称为“文章标题”,“缩略图”,“附加信息”和其他标签,然后是每个列表页面这些同名标签之间的关系是什么,以及如何使用它们.

  

  一个,同一列表页面的标签

  与单列表页面一样,可以在URL综合中调用从页面列表分析获得的[页面地址]和[附加信息].

  两个,在不同列表页面上具有相同名称的标签

  1,[文章标题]

  从多个列表页面获得的[文章标题]在删除第一个和最后一个空白字符后,将从上到下合并,并用空格分隔.

  合并的内容将用作“列表数据文章标题”,在采集目录时将显示该内容,并可在数据排序中调出该内容.

  如果未在数据项中设置“标题”数据项的采集规则,它将用作“标题”数据项的值.

  2,[缩略图]

  如果有多个带有[thumbnail]标记的列表页面,则只有上次获得的[thumbnail]才有效.

  它将用作“列表数据缩略图”,可用于数据排序.

  如果“缩略图”数据项未设置任何采集规则,它将用作“缩略图”数据项的值.

  3,[附加信息]

  [附加信息]具有三个标签,用法相同.

  如果使用[附加信息]]标签有多个列表页,则只有上次获得的[附加信息]]有效.

  它将用作“列表数据附加信息”,可在数据排序中调用.

  从版本3.1.7开始,如果列表分析规则中未使用[附加信息]标签,但URL合成中使用了[附加信息]标签,则该标签的值将调用相同的上方列表页面中的名称[其他信息]标签的值,即上方列表页面中具有相同名称的最后一个有效标签的值.

  为什么不能在发布配置的检查URL中调用数据项

  在发布配置的检查URL栏中,只有一个[文章标题]按钮,并且其他数据项的值无法在此处调用.

  

  由于在使用检查URL进行商品重复检查时ET尚未执行数据项的采集,因此自然无法调用数据项的值. 这是一种提高效率并节省时间的设计.

  如果在采集所有数据项之后执行文章重复检查,那么当重复文章时,以前的所有工作将无用,从而造成极大的浪费.

  当用户有多个数据项值来参与重复检查的需要时,可以将文章重复检查功能添加到发布界面文件中,并且检查URL将保留为空白,并且检查URL将不能用于文章重复检查.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线