关键词自动采集生成内容系统-无需任何打理(网站采集测试的基本功能和条件保存-乐题库)
优采云 发布时间: 2021-09-01 15:02关键词自动采集生成内容系统-无需任何打理(网站采集测试的基本功能和条件保存-乐题库)
5、采集Test:这是任何其他类似的采集 软件都无法比拟的。程序支持直接查看采集结果和测试发布。
6、 管理便捷:使用站点+任务模式管理采集节点,任务支持批量操作,更轻松的数据管理。
基本功能
1、Rule 自定义-通过采集rule 的定义,您可以搜索所有网站采集 几乎任何类型的信息。
2、Multitasking,多线程——可以同时执行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得-任务采集Process 所见即所得。链接信息、采集信息、过程中遍历的错误信息都会及时反映在软件界面中。
4、数据保存-数据边采集边自动保存到关系型数据库中,自动适配数据结构。软件可以根据采集规则自动创建数据库,以及其中的表和字段,或者通过引导数据库的方式灵活地将数据保存到客户现有的数据库结构中。
5、断点再采-信息采集任务停止后可以从断点恢复采集。从此,你再也不用担心你的采集任务被意外中断了。
6、网站Login-支持网站Cookie,支持网站可视化登录,甚至登录时需要验证码的网站也可以采集。
7、Scheduled tasks-这个功能可以让你的采集任务有规律的、定量的或者一直循环执行。
8、采集Scope 限制-采集的范围可以根据采集的深度和URL的logo进行限制。
9、File Download-采集收到的二进制文件(如图片、音乐、软件、文档等)可以下载到本地磁盘或采集结果数据库。
10、Result 替换-您可以根据规则将采集的结果替换为您定义的内容。
11、条件保存-您可以根据一定条件决定保存和过滤哪些信息。
12、过滤重复内容——软件可以根据用户设置和实际情况自动删除重复内容和重复网址。
13、特殊链接识别-使用此功能识别由JavaScript动态生成的链接或其他奇怪的链接。
14、数据发布-您可以通过自定义接口将采集的结果数据发布到任何内容管理系统和指定的数据库。目前支持的目标发布媒体包括:数据库(access、sql server、my sql、oracle)、静态htm文件。
15、预留编程接口-定义多种编程接口,用户可在活动中使用PHP、C#语言进行编程,扩展采集功能。
更新日志:
1:自动获取cookie功能优化
2:增加数据库发布交易次数,优化数据库发布速度
3:数据转换速度优化(针对Mysql和SqlServer数据库的导入),同时去除URL数据库的空逻辑
4:html标签处理错误问题处理
5:json提取及处理将数字转为科学记数法的问题
6:处理发布测试时图片上传无效问题
7:采集content页面处理错误时,添加当前错误标签提示,快速定位错误标签
8:批量编辑任务,增加操作范围
9:处理循环匹配和空格匹配问题
10:增加刷新组统计数据的刷新
11:分页后处理
12:部分功能的逻辑优化
上一篇:Nat123下载_Nat123端口映射工具绿色版
下一篇:Video Ad Filter Master(强大的视频广告拦截软件)2020正式版