智能网络内容采集器v1.92
优采云 发布时间: 2020-08-07 22:17Smart Web Content Collector可以以多任务和多线程的方式采集任何网页上的任何指定文本内容,并执行所需的相应过滤和处理. 它可以通过搜索关键字来采集所需的指定搜索结果.
1. 底层HTTP方法用于快速,稳定地采集数据,并且可以构建多个任务和多个线程来同时从多个网站采集数据
2,用户可以随意导入和导出任务
3. 可以设置该任务的密码,并具有N页采集暂停,遇到特殊标记时采集暂停等多种破解反采集功能
4. 您可以直接输入网址,也可以通过JavaScript脚本生成网址,或通过关键字搜索来采集网址
5. 您可以使用登录采集方法来采集需要登录帐户才能查看的Web内容
6. 在N列中无限深入地采集内容和链接
7. 支持多种内容提取模式,您可以根据需要处理采集的内容,例如清除HTML,图片等.
8. 您可以编译自己的JAVASCRIPT脚本以提取网页的内容,并轻松实现内容的任何部分的采集
9. 可以根据设置的模板保存采集到的文本内容
10. 可以根据模板将多个文件保存到同一文件中
11. 针对网页的多个部分分别进行分页内容采集
12. 可以设置客户信息以模拟百度等搜索引擎采集目标网站的情况
13. 该软件是永久免费的
智能Web内容采集器v1.9更新:
内置软件URL已更新为
使用新的智能软件控件UI
向EMAIL功能添加用户反馈
添加直接将初始链接设置为最终内容页面处理功能的功能
增强内核功能,支持关键字搜索并替换POST中的关键字标签
优化获取核心
优化断开的拨号算法
优化重复数据删除工具的算法
修复了拨号显示IP错误的错误
修复了错误关键字被暂停或拨打时未重新采集错误页面的错误.
修复了受限内容的最大值为0时,最小值无法正确保存的问题.