智能Web内容采集器V1.92免费安装版本
优采云 发布时间: 2020-08-06 07:01智能Web内容采集器,一种多任务和多线程的方法,可以采集任何网页上的任何指定文本内容,并执行所需的相应过滤和处理,您可以使用搜索关键字来采集所需的指定搜索结果.
软件功能
1. 使用基础的HTTP方法来采集数据,这是快速且稳定的. 可以构建多个任务和线程来同时从多个网站采集数据.
2. 用户可以随意导入和导出任务.
3. 该任务可以设置密码,并具有N页采集暂停,带有特殊标记的采集暂停和其他防捕获功能.
4. 您可以直接输入要捕获的URL,或使用JavaScript脚本生成URL,或通过关键字搜索捕获URL.
5. 您可以使用登录采集方法来采集需要登录帐户才能查看的Web内容.
6. 在N列中无限深入地采集内容和链接.
7. 它支持多种内容提取模式,并可以根据需要处理采集的内容,例如清除HTML,图片等.
8. 您可以编译自己的JAVASCRIPT脚本以提取网页的内容,并轻松实现内容的任何部分的采集.
9. 可以根据设置的模板保存采集的文本内容.
10. 可以将多个文件作为模板保存到同一文件.
11. 针对网页的多个部分分别进行页面内容采集.
12. 可以设置客户信息,以模拟百度等搜索引擎对目标网站的采集.
13. 该软件可以永久免费使用.
软件更新
使用新的智能软件控件UI.
向EMAIL功能添加用户反馈.
添加直接将初始链接设置为最终内容页面处理功能的功能.
增强内核功能,支持关键字搜索并替换POST中的关键字标签.
优化获取核心.
优化断开的拨号算法.
优化重复数据删除工具的算法.
修复了拨号显示IP错误的问题.
修复了当错误关键字被暂停或拨打时,错误页面没有被再次采集的错误.
修复了受限内容的最大值为0时,最小值无法正确保存的问题.