无需规则自动采集(24小时无人监管自动采集,有需要的用户不要错过了)
优采云 发布时间: 2022-01-22 07:07无需规则自动采集(24小时无人监管自动采集,有需要的用户不要错过了)
EditorTools3是一款功能强大且免费的自动信息采集软件,可以帮助用户实时监控采集指定站点的内容,支持一键下载文字、图片、视频、音频等文件,24小时无人监管自动采集,需要的用户不要错过,欢迎下载使用!
软件功能
1、开机自动运行ET:启动电脑进入系统后,自动运行ET程序;
2、ET启动后自动工作:ET启动运行后,会自动执行上次使用ET时勾选的工作计划。只有启用该选项时,才会自动保存当前选中的工作计划;
3、启动后最小化:ET启动后,主窗口隐藏,只显示托盘图标;
4、忽略规则开头和结尾的空格:启用该选项后,采集配置中的每条规则都会自动去除空格字符,例如前导和尾随空格、回车、换行等。 , 防止用户输入更多空格或换行导致规则分析失败;如果用户需要使用空格或换行符来确定规则的开始和结束边界,请取消勾选;
5、计划执行间隔:当进行自动工作并选择多个方案时,当前一个方案采集列表完成后,需要多长时间替换下一个采集方案;
6、接入网络超时:设置接入网络的时间,如果没有响应,则强制断开;
7、访问网络重试次数:设置访问网络失败的自动重试次数,如采集网页、文件下载、FTP上传等。这是2.版本2新增特点;
8、网页访问失败自动重启ET:设置ET在网页访问失败一定次数后自动重启,解决一些可能导致网络拥塞的问题继续正常工作;此功能仅在自动工作时生效。停止自动工作会重置失败计数,重试访问不计算在内;这是 2.3. 版本 7 中的新功能;
软件功能
【全自动无人值守】
无需人工值班,24小时自动实时监控目标,实时高效采集,全天候为您提供内容更新。满足长期运行的需求,让您摆脱繁重的工作量
【适用范围广】
最全能的采集软件,支持任意类型的网站采集,应用率高达99.9%,支持发布到所有类型的网站 程序等您可以在不发布接口的情况下采集本地文件。
【你想要的信息】
支持信息自由组合,通过强大的数据排序功能对信息进行深度处理,创造新的内容
【任意格式文件下载】
无论是静态还是动态,无论是图片、音乐、电影、软件,还是PDF文档、WORD文档,甚至是torrent文件,只要你想要
【伪原创】
高速同义词替换、随机多词替换、随机段落排序,助力内容SEO
【无限多级页面采集】
无论是垂直方向的多层页面,平行方向的复杂页面,还是AJAX调用的页面,都轻松搞定采集
【自由扩展】
开放接口模式,免费二次开发,自定义任意功能,实现所有需求
软件功能
设置劫持特征码;
很多地区的电信宽带用户在上网时会被迫使用一些代码来代替接入信息中的接入信息,使用户只能通过代码中的边框查看自己想访问的网页。这通常用于显示电信广告或信息。执行其他隐身动作,这种行为称为劫持浏览器;出现这种情况时,ET的采集的源码只能获取到这些劫持码,而网页想获取采集的源码
设置用户代理;
网站使用userAgent判断当前用户使用的是什么浏览器,根据浏览器可以支持的情况提供相应的功能。当浏览器访问一个网页时,它通常会发送一个标识字符串来告诉 网站 它是什么浏览器软件。我们访问 网站 的部分会限制 UserAgent。我们可以在基本设置中修改 UserAgent。,也可以点击“获取本机UserAgent”按钮获取本地IE默认UserAgent
设置支持的语言;
采集部分网页网站可能会检查支持的语言,用户可以在这里调整。
锁定设置
此功能用于在打开每个配置窗口时设置密码。设置锁定密码后,使用菜单锁定功能,防止他人在用户离开计算机后访问和操作各种配置。
数据项设置
数据项用于定义从采集页面获取的各种信息,除了[title]、[thumbnail]、[文章 URL](即[文章 URL]在发布规则中)这三个数据可以在列表设置页面之外获取
数据项属性编辑区
[Thumbnail]、[Title]、[Body]、[文章URL]四个基本数据项的名称不可修改。
[文章URL] 数据项的值是列表规则中的文章 URL 合成的结果。
[title]数据项对应列表分析中的[文章title]标签,默认值为列表分析得到的文章标题。
【缩略图】数据项对应列表分析中的【缩略图】标签,默认值为列表分析得到的缩略图。
特征
应用广泛
更通用的采集软件,支持任意类型的网站采集,应用率高达99.9%,支持发布到所有类型的网站程序,更多采集本地文件,免界面发布。
你想要的信息
支持信息自由组合,通过强大的数据排序功能对信息进行深度处理,创造新的内容
以任何格式下载任何文件
无论是静态还是动态,无论是图片、音乐、电影、软件,还是PDF文档、WORD文档,甚至是torrent文件,只要你想要
伪原创
高速同义词替换、随机多词替换、随机段落排序,助力内容SEO
无限多级页面采集
无论是垂直方向的多层页面,平行方向的复杂页面,还是AJAX调用的页面,都轻松搞定采集
自由扩展
开放接口模式,免费二次开发,自定义任意功能,实现所有需求
软件内置discuzX、phpwind、dedecms、wordpress、phpcms、empirecms、dongyi、joomla、pbdigg、php168、bbsxp、phpbb、dvbbs、typecho、emblog等常用系统的例子。
主要优势
1、*敏*感*词*:
该栏记录了ET各步骤的工作过程和状态,包括目录采集和文章处理两大部分。通过工作记录,我们可以知道这个采集的执行是否正确完成,或者有什么问题?当出现问题时,用户可以根据信息栏中的提示和其他反馈内容,快速准确地查找故障原因并予以解决。
2、采集源码:
本栏目展示了采集在执行过程中的文章列表页面、文章页面、文章页面等的源码。规则测试,为规则定制提供依据。
注意有些网站会根据不同的访问浏览器显示不同的源码。因此,自定义ET的采集规则时,应以本栏目源码为准,例如采集规则示例中的'SMF1.1.5'为不同于网站通过IE和优采云采集器获取的源码。
3、分析数据:
本栏展示了文章处理过程中各个数据项的信息,从分析的原创代码,到排序后的代码,再到URL修正后的代码,用户可以通过查看本栏了解设置的数据项目分析规则是否准确,排序分组规则是否完整,最终信息是否符合自己的要求。
例如:当工作记录栏提示错误“正文中的文本数量大于或小于发布设置”时,我们可以查看该栏的“正文”数据项,看看是大于还是小于发布设置,是正常原因还是组织组设置不当。从而调整每个设置。
4、发送代码:
该栏显示ET发送到发布网站的数据,包括文章检查部分和文章发布部分;
用户可以通过该栏目中的信息,通过一系列的分析和排序操作,了解提交给发布网站的数据,查看自己的采集规则数据项是否以及发布规则的参数设置是正确的,完整的。
5、返回信息:
该栏显示ET发送数据释放网站后释放网站的反馈,包括文章检查反馈和文章释放反馈;
通过查看本专栏,我们可以清楚地看到 采集 进程出错的大部分原因。
有些接口返回错误信息时,可能是HTML代码,不熟悉HTML代码的用户难以阅读。点击WEB浏览按钮,可以在操作系统的默认浏览器中方便地查看。