无人看管的免费自动采集器

优采云 发布时间: 2020-08-07 07:16

  无人值守的免费自动采集器的中文绿色版本是一款非常易于使用的网络优化软件. 我们的软件使用网站自己的数据发布界面或程序代码来处理和发布信息,并且不会直接操作网站数据库,从而避免了由ET引起的任何数据安全问题. 为了保持网站的生命力,每日内容更新是基础. 小型网站保证每天都会更新,通常要求网站管理员每天和周末每天进行8个小时的更新工作;一个中型网站要全天维护内容更新,通常每天需要轮班3次,每轮班需要2-3位管理员. 中小型网站是自动更新的工具,好的助手,自动采集和发布,操作过程中的静默工作,无需人工干预;独立软件免除网站性能消耗;安全稳定,并且可以连续工作多年. ET使用标准的HTTP端口,不会导致网络安全漏洞. 除通用采集工具的功能外,ET还支持网站管理员和管理,包括支持图像水印,防盗链,分页采集,答复采集,登录采集,自定义项目,UTF-8,UBB,模拟发布.... 从繁琐而无聊的网站更新工作中解放出来!如果需要,可以在这里下载!

  

  软件功能1.设置计划后,它可以自动运行24小时,而无需人工干预.

  2. 它与网站分离,可以通过独立制作的界面支持任何网站或数据库

  3. 灵活而强大的采集规则不仅适用于采集文章,还适用于采集任何类型的信息

  4. 体积小,功耗低,稳定性好,非常适合在服务器上运行

  5. 所有规则均可导入和导出,灵活的资源重用

  6. 使用FTP上传文件,稳定又安全

  7,下载和上传支持断点续传

  8,高速伪原创软件功能1,可以选择反向,顺序,随机采集文章

  2. 支持自动列表URL

  3. 支持在多个页面上分布数据的网站采集

  4. 自由设置采集的数据项,并可以分别过滤和排序每个数据项

  5. 支持分页内容采集

  6. 支持下载任何格式和类型的文件(包括图片和视频)

  7,可以突破防盗文件

  8. 支持动态文件URL分析

  9. 支持需要登录才能访问的网页的集合

  10. 可以设置关键字集合

  11. 可以设置防止采集的敏感词

  12. 可以设置图片水印. 该软件的亮点1.支持发布带有回复的文章,可广泛用于论坛,博客和其他项目中

  2. 从采集的数据中分离出来的释放参数项可以自由地对应于采集的数据或预设值,从而大大提高了释放规则的可重用性

  3. 支持随机选择发布帐户

  4. 支持发布项目的任何语言翻译

  5,支持编码转换,支持UBB代码

  6. 可以选择文件上传来自动创建年,月和日目录

  7. 模拟发布支持在无法安装界面的网站上进行发布操作

  8. 该程序可以正常运行

  9. 防止网络运营商劫持HTTP功能

  10. 您可以手动采集和发布单个项目

  11. 详细的工作流程监控和信息反馈,使您可以快速了解工作状态. 使用说明1.选择工作计划

  工作计划收录所有设置的说明,这些说明用于从源获取原创信息,处理信息并最终发布到目标网站. 它是ET自动采集工作的指挥官. 制定好我们需要的计划后(请参考用户手册的设置来制定计划),您可以在主窗口中选择工作计划并开始采集工作.

  1. 了解项目区域;

  主窗口左上角的树形目录区域是项目区域. 点击鼠标右键,弹出操作菜单

  无人看管的免费自动采集器(网站自动更新工具)

  2,检查计划;

  单击程序名称前面的选择框,选择要执行的程序,可以进行多种选择

  无人看管的免费自动采集器(网站自动更新工具)

  如果所选计划缺少关键配置,则会显示提示,并且未选中选择

  无人看管的免费自动采集器(网站自动更新工具)

  ET运行时,它将首先从当前的重点计划开始,即以蓝色突出显示的计划,请参见图4中的“ Website-discuz 6.0(带有响应)”

  无人看管的免费自动采集器(网站自动更新工具)

  所选的多个程序将循环执行.

  在主窗口右上方的文章列表区域中,将显示所选焦点方案的待处理文章.

  右键单击项目名称以弹出菜单

  无人看管的免费自动采集器(网站自动更新工具)

  单击以编辑计划,它将进入计划编辑窗口;

  双击项目名称,也可以直接进入项目编辑窗口.

  第二项自动工作

  选择要执行的工作计划后,单击主窗口左下方的“自动”按钮以开始全自动工作. 从那时起,用户可以扔掉鼠标和键盘,搁置乏味的网站更新,而Friends一起旅行,网站内容具有自己的ET可以为您静默采集更新

  无人看管的免费自动采集器(网站自动更新工具)

  要停止自动工作,请点击“停止”按钮;

  三,手工

  在程序调试期间,通常使用手动获取.

  1. 采集目录;

  点击主窗口左下方的“采集目录”按钮,ET将为当前选择的焦点方案执行目录采集,如果没有焦点方案,它将按顺序执行

  无人看管的免费自动采集器(网站自动更新工具)

  采集的目录信息显示在主窗口右上方的文章列表区域中

  无人看管的免费自动采集器(网站自动更新工具)

  注意: 修改程序的采集规则后,未发布的文章将被自动清除,包括那些未能发送的文章,以防止用户继续使用不正确的文章条目进行采集.

  2,处理文章;

  在商品列表区域中有要处理的商品时,单击主窗口左下方的“处理商品”按钮,将按顺序采集在商品列表区域中要处理的第一条商品

  无人看管的免费自动采集器(网站自动更新工具)

  在处理商品期间,工作记录将显示在主窗口右下方的信息区域中

  无人看管的免费自动采集器(网站自动更新工具)

  处理后,文章列表区域中的相应条目将显示处理状态

  无人看管的免费自动采集器(网站自动更新工具)

  3. 手动处理文章的另一种方法;

  在文章列表区域中,双击一个文章条目,无论该文章是否已处理,都将对该文章执行采集操作.

  四个. 了解文章列表区域

  主窗口右上方的表格区域是文章列表区域,其中显示了已执行项目的待处理文章

  1. 文章列表区域中各列的说明;

  文章采集标题: 这是通过采集规则列表分析规则获得的文章标题. 如果采集规则未设置标题数据项的分析规则,则ET将使用此处的文章采集标题作为发布标题. 可以更改采集标题,单击标题后的省略号按钮,无人看管的免费自动采集器(网站自动更新工具)可以进入编辑状态.

  状态发送: 当此项的值为YES时,表示文章已成功发布;

  状态敏感: 当此项的值为YES时,表示文章正文收录敏感关键字;

  状态错误: 0表示没有错误,请参见相关主题以了解其他错误代码的含义;

  状态处理: 选中的项目项已被执行,您可以单击以取消检查以使其再次执行;

  2,转换显示代码;

  右键单击文章列表区域,将弹出编码菜单

  无人看管的免费自动采集器(网站自动更新工具)

  3. 双击以执行文章采集;

  如前一部分所述,您可以双击文章列表区域中的文章条目以执行其采集;

  4. 浏览按钮;

  单击文章条目的浏览按钮,您可以访问文章URL,用于确认URL是否正确,查看网页的源代码等.

  无人看管的免费自动采集器(自动网站更新工具)5.了解信息栏

  信息栏用于跟踪执行过程并反馈各种信息. 这是了解电子烟的工作条件,解决采集中遇到的问题的重要工具.

  1. 工作记录:

  此列记录ET的每个步骤的工作过程和状态,包括两部分: 目录采集和文章处理. 通过工作记录,我们可以知道采集是否正确完成或发生了什么问题;当出现问题时,根据提示,结合信息栏中的其他反馈内容,用户可以快速,准确地找到故障原因并解决.

  2. 源代码集合:

  此列显示执行期间采集的文章列表页面,文章页面,文章分页等的源代码. 此列的源代码可用于促进规则测试,并为规则定制提供基础.

  请注意,某些网站会根据访问的浏览器显示不同的源代码. 因此,在自定义ET的采集规则时,应以此列中的源代码为准,例如'SMF 1.1. 5'中,通过IE访问获得的源代码与通过优采云采集器获得的源代码之间存在差异.

  3. 分析数据:

  此列显示文章处理中每个数据项的信息,从分析的原创代码到排序的代码,再到URL校正后的代码,用户可以通过查看此列来了解设置的数据项. 规则是否正确,归类组规则是否完整以及最终信息是否满足您的要求.

  例如: 当工作记录列提示错误“正数大于或小于发布设置”时,我们可以检查此列中的“正文”数据项以找出是否大于小于或小于释放设置,这是正常的还是归类组设置不正确,请调整每个设置.

  4. 发送代码:

  此列显示ET发送到发布网站的数据,包括文章检查部分和文章发布部分;

  用户可以使用此列中的信息通过一系列分析和排序操作来了解最终提交给发布网站的数据,以检查他们自己的采集规则数据项和发布规则参数设置是否正确和完整.

  5. 返回信息:

  此列显示ET向发布网站发送数据后发布网站的反馈,包括文章检查反馈和文章发布反馈;

  通过查看此列,我们可以清楚地了解采集过程中出现问题的大多数原因.

  当某些接口返回错误信息时,该信息可能是HTML代码. 不熟悉HTML代码的用户很难阅读. 单击“ WEB浏览”按钮可在操作系统的默认浏览器中轻松查看它们. 更新日志1.纠正: 每天程序执行时间不正确的问题.

  2. 优化: 提高数据提取的准确性和兼容性.

  3. 优化: SFTP兼容性得到改善.

  4. 优化: 采集配置测试结果窗口现在可以自动记住位置和大小.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线