智动网页内容采集器
优采云 发布时间: 2020-08-25 14:30智动网页内容采集器
【概括介绍】任意网站内容采集。【基本介绍】1、采用底层HTTP方法采集数据,快速稳定,可建多个任务多线程采同时采集多个网站数据2、用户可以随便导出导入任务3、任务可以设置密码,保障您采集任务的细节安全不泄露4、并具有N页采集暂停/拨号换IP,采集遇特殊标记暂停/拨号换IP等多种破解防采集功能5、可以直接输入网址采,或JavaScript脚本生成网址,或以关键词搜索方法采集6、可以用登陆采集方式采集需要登入账号能够查看的网页内容7、可以无限深入N个栏目采集内容、采链接,支持多级内容分页采集8、支持多种内容提取模式,可以对采到的内容进行你须要的处理,如消除HTML,图片等等9、可自编JAVASCRIPT脚本来提取网页内容,轻松实现任意部份内容的采集10、可按设定的模版保存采到的文本内容11、可将采到的多个文件按模版保存到同一个文件中12、可对网页上的多个部份内容分别进行分页内容采集13、可自设顾客信息模拟百度等搜索引擎对目标网站采集14、本软件永久终生免费使用【更新日志】采用全新的智动软件控件UI降低用户反馈到EMAIL功能降低将初始化链接直接设置作为最终内容页处理功能强化内核功能,支持关键词搜索替换POST内的关键词标记优化采集内核优化断线拔号算法优化去重复工具算法修正拔号显示IP不正确BUG修正遇出错关键词暂停或拔号时没有重新采集出错页面的BUG修正限定内容最大值为0时,最小值未能正确保存BUG