采集文章系统( CmsTop文章采集系统颠覆传统采集模式和流程,规则设置更简单 )

优采云 发布时间: 2021-11-12 11:18

  采集文章系统(

CmsTop文章采集系统颠覆传统采集模式和流程,规则设置更简单

)

  5.24 文章采集

  文章的采集功能是通过程序远程获取目标网页的内容,解析处理本地规则后存储到服务器的数据库中。cmsTop文章采集系统颠覆了传统的采集模式和流程,采集规则与采集界面分离,规则设置更简单,只需具备基本网页设计知识的人设置相关规则即可。编辑者无需了解太详细的技术规则,只需选择自己想要的文章列表采集,就可以像发布文章一样轻松完成采集操作,提高提高工作效率,降低人工成本。

  1. 高效的采集 管理界面

  自定义配置的所有采集规则都会显示在采集管理界面,根据采集的更新频率可以找到最新的文章。系统通过最新的,查看过的,文章的状态已经被标记为采集。曾经采集的文章会自动从采集列表中消失,进入采集的列表,不会重复采集。同时可以根据已经设置的采集规则快速输入网址。

  

  图5.24‑1采集界面

  管理者可以通过采集管理界面预览采集的内容,然后有选择地对需要的文章进行采集。添加任务很方便,并允许自定义目标列。

  

  图 5.24‑2文章采集 预览

  

  图5.24-3 编辑监控任务

  

  图5.24‑4 自定义目标列

  2. 方便简洁的采集规则配置

  对于需要采集功能的网站来说,简单方便的规则配置就是易用性的体现。技术人员只需要基本的网页知识就可以自由编写采集规则。在编写规则时,可以实时显示采集的内容是否正确。通过此功能,您可以轻松测试内容的可用性。此外,它还对一些详细的采集设置提供了很好的支持,比如采集分页内容,设置是否远程图像定位等。

  

  图5.24‑5采集 规则设置

  3. 采集 规则导入导出

  对于已经写入的采集规则,系统会自动将其添加到规则列表中以备后用。每个规则都可以重复使用,并且可以根据需要进行修改。同时,您还可以将您设置的采集规则导出到XML文件中,与他人共享,或导入他人共享的规则。

  

  图5.24‑6 规则导入

  4. 支持 文章 计时采集

  系统内置采集功能,可以手动选择采集,也可以手动选择采集,也可以设置定时采集。提供定时采集任务切换。通过设置采集间隔、采集件数、下一次采集,系统可实现自取,无需人工干预,节省人力资源。面对系统自动完成的操作,管理员查看系统工作日志是必不可少的一环。系统增加了计时采集日志功能菜单,可以查看特定时间段内采集成功和失败的次数。文章数。您还可以一键清理采集 日志。

  5. 支持过滤重复标题

  采集 过程中的头衔重复是采集人员头疼的问题。无论是手动采集还是自动采集,都无法避免这个问题。提供过滤重复标题的开关,采集人员可以随时开启和关闭过滤功能。具有过滤重复标题的功能,可以直接过滤重复的标题,使其不再出现在采集列表中,从而消除采集的重复内容。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线