智能网络内容采集器v1.92

优采云 发布时间: 2020-08-07 22:17

  Smart Web Content Collector可以以多任务和多线程的方式采集任何网页上的任何指定文本内容,并执行所需的相应过滤和处理. 它可以通过搜索关键字来采集所需的指定搜索结果.

  1. 底层HTTP方法用于快速,稳定地采集数据,并且可以构建多个任务和多个线程来同时从多个网站采集数据

  2,用户可以随意导入和导出任务

  3. 可以设置该任务的密码,并具有N页采集暂停,遇到特殊标记时采集暂停等多种破解反采集功能

  4. 您可以直接输入网址,也可以通过JavaScript脚本生成网址,或通过关键字搜索来采集网址

  5. 您可以使用登录采集方法来采集需要登录帐户才能查看的Web内容

  6. 在N列中无限深入地采集内容和链接

  7. 支持多种内容提取模式,您可以根据需要处理采集的内容,例如清除HTML,图片等.

  8. 您可以编译自己的JAVASCRIPT脚本以提取网页的内容,并轻松实现内容的任何部分的采集

  9. 可以根据设置的模板保存采集到的文本内容

  10. 可以根据模板将多个文件保存到同一文件中

  11. 针对网页的多个部分分别进行分页内容采集

  12. 可以设置客户信息以模拟百度等搜索引擎采集目标网站的情况

  13. 该软件是永久免费的

  智能Web内容采集器v1.9更新:

  内置软件URL已更新为

  使用新的智能软件控件UI

  向EMAIL功能添加用户反馈

  添加直接将初始链接设置为最终内容页面处理功能的功能

  增强内核功能,支持关键字搜索并替换POST中的关键字标签

  优化获取核心

  优化断开的拨号算法

  优化重复数据删除工具的算法

  修复了拨号显示IP错误的错误

  修复了错误关键字被暂停或拨打时未重新采集错误页面的错误.

  修复了受限内容的最大值为0时,最小值无法正确保存的问题.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线