网站自动采集系统(支持实时保存到任意格式的文件支持自定义的采集任务配置界面)
优采云 发布时间: 2021-08-31 01:00网站自动采集系统(支持实时保存到任意格式的文件支持自定义的采集任务配置界面)
Easy 采集网站数据采集系统是一款全面、准确、稳定、易用的网络信息采集软件。它可以轻松抓取您想要的网页内容(包括文本、图片、文件、HTML 源代码等)。
Easy Mining网站数据采集系统,可以轻松抓取你想要的网页内容(包括文字、图片、文件、HTML源代码等),采集收到的数据可以直接导出为EXCEL,也可以根据自己定义的模板保存为任意格式的文件(如网页文件、txt文件等)。也可以保存到数据库,发送到网站服务器,和采集同时保存到一个文件中。
软件功能
用户只需点击鼠标即可配置采集任务,实现所见即所得的采集task配置界面;
网页内容的变化(如文本添加、更改、文本颜色、字体更改等)不会影响采集的准确性。
支持任务嵌套,采集unlimited-level页面内容只需在当前任务页面中选择你想要采集下级页面的链接即可创建嵌套任务,采集下级页面的内容,并且嵌套层数是无限的。这种便利归功于我们新的内容定位方法和图形化的采集 任务配置界面。
您可以同时采集任何内容。除了最基本的文字、图片、文件,你还可以采集具体的HTML标签的源代码和属性值。强大的信息自动再处理能力 您可以在配置任务时指定对采集到达的内容进行任意替换和过滤。
采集到达的内容可以自动排序
支持采集结果保存为EXCEL和任何格式的文件。支持自定义文件模板。
支持实时保存到数据库。支持ACCESS、SQLSERVER、MYSQL数据库(后续版本也会支持更多类型的数据库)。
支持实时上传到网站服务器。支持 POST 和 GET 方法。上传参数可自定义,模拟手动提交。
支持实时保存到任何格式的文件。支持自定义模板,按记录保存和将多条记录保存到单个文件,支持大纲和细节保存(所有记录的部分内容保存在一个大纲文件中,然后每条记录分别保存到一个文件中。
支持多种灵活的任务调度方式,实现无人值守采集
支持多任务,支持任务导入导出