智能Web内容采集器
优采云 发布时间: 2020-08-06 08:26这是一个智能的Web内容采集器. 它可以多任务和多线程模式采集任何网页上的任何指定文本内容,并执行所需的相应过滤和处理. 您可以使用搜索关键字来采集所需的指定搜索结果. ..
软件简介
Smart Web Content Collector使您可以通过多个线程快速采集网页上所需的任何文本内容. 同时,您可以设置过滤和相应的处理,并支持关键字搜索.
软件功能
1. 使用基础的HTTP方法来采集数据,这是快速且稳定的. 可以构建多个任务和线程来同时从多个网站采集数据
2,用户可以随意导入和导出任务
3. 可以使用密码设置该任务,以确保您的采集任务的详细信息不会泄漏.
4. 它还具有N页采集暂停/拨号到IP更改,具有特殊标记暂停/拨号到IP更改的采集以及其他防捕获功能.
5. 您可以直接输入要捕获的URL,或使用JavaScript脚本生成URL,或通过关键字搜索捕获它
6. 您可以使用登录采集方法来采集需要登录帐户才能查看的Web内容
7. 它可以无限期地在N列中采集内容和链接,并支持多级内容分页采集
8. 支持多种内容提取模式,您可以根据需要处理采集的内容,例如清除HTML,图片等.
9. 您可以编译自己的JAVASCRIPT脚本以提取网页的内容,并轻松实现内容的任何部分的采集
10. 可以根据设置的模板保存采集到的文本内容
11. 可以根据模板将多个文件保存到同一文件中
12. 分页内容采集可以分别在网页的多个部分上进行
13. 可以设置客户信息以模拟百度等搜索引擎采集目标网站的情况
14. 该软件是永久免费的
相关更新
使用新的智能软件控件UI
向EMAIL功能添加用户反馈
添加直接将初始链接设置为最终内容页面处理功能的功能
增强内核功能,支持关键字搜索并替换POST中的关键字标签
优化获取核心
优化断开的拨号算法
优化重复数据删除工具的算法
修复了拨号显示IP错误的错误
修复了错误关键字被暂停或拨打时未重新采集错误页面的错误.
修复了受限内容的最大值为0时,最小值无法正确保存的问题.
软件屏幕截图