强大的信息自动再加工能力你可以在配置任务的时候
优采云 发布时间: 2021-03-30 19:03强大的信息自动再加工能力你可以在配置任务的时候
易于采集网站数据采集系统是一款全面,准确,稳定且易于使用的网络信息采集软件。它可以轻松获取所需的Web内容(包括文本,图片,文件,HTML源代码等)。
基本介绍
网站数据采集系统,您可以轻松获取所需的Web内容(包括文本,图片,文件,HTML源代码等),并且采集中的数据可以直接导出到,也可以根据您定义的模板将其保存为任何格式的文件(例如网页文件,txt文件等)。也可以将其保存到数据库,发送到网站服务器,并与采集同时保存到文件。
软件功能
用户只需单击鼠标即可配置采集任务,从而实现所见即所得采集任务配置界面;
网络内容的更改(例如,添加,删除,更改,文本颜色,字体更改等)不会影响采集的准确性。
支持任务嵌套,采集个页面内容不受限制,只需在当前任务页面中选择想要的采集下层页面的链接即可创建嵌套任务,采集下层页面的内容,以及嵌套级别的数量是无限的。之所以方便,是因为我们采用了全新的内容定位方法和图形化的采集任务配置界面。
您可以同时采集任何内容。除了最基本的文本,图片和文件,您还可以采集定位特定HTML标签的源代码和属性值。强大的信息自动重处理能力在配置任务时,您可以在采集中指定对内容的任何替换和过滤。
采集的内容可以自动排序
支持采集将结果保存到和任何格式的文件中。支持自定义文件模板。
支持实时保存到数据库。支持数据库(以后的版本将支持更多类型的数据库)。
支持实时上传到网站服务器。它支持POST和GET方法,并可以自定义上传参数以模拟手动提交。
支持实时保存到任何格式的文件。支持自定义模板,根据记录保存并将多个记录保存到一个文件中,并支持大纲和明细保存(所有记录的某些内容保存在大纲文件中,然后将每个记录分别保存到一个文件中。
支持多种灵活的任务调度方法以实现无人值守采集
支持多任务,支持任务导入和导出