SysNucleus WebHarvy破解版（网络数据采集器）v6.0.1

优采云发布时间: 2020-08-07 17:07

　　SysNucleus WebHarvy是具有自动检测模式的Web数据捕获工具，可以从多个页面提取数据并将其导出到数据库或文件夹. WebHarvy支持运行JavaScript和表达式，使您可以灵活地获取数据. 需要它的朋友，下载它！

　　WebHarvy功能

　　点击界面

　　WebHarvy是可视化的网络抓取工具. 绝对不需要编写任何脚本或代码来获取数据. 您将使用WebHarvy的内置浏览器浏览网络. 您可以选择要单击的数据. 很简单！

　　自动模式检测

　　WebHarvy自动识别网页中出现的数据模式. 因此，如果您需要从网页上抓取项目列表（名称，地址，电子邮件，价格等），则无需执行任何其他配置. 如果数据重复，WebHarvy将自动将其删除.

　　导出捕获的数据

　　您可以以多种格式保存从网页提取的数据. 当前版本的WebHarvyWebScraper允许您将抓取的数据导出为Excel，XML，CSV，JSON或TSV文件. 您还可以将捕获的数据导出到SQL数据库.

　　从多个页面提取数据

　　通常，网页在多个页面上显示数据，例如产品列表. WebHarvy可以自动爬网并从多个页面提取数据. 只需指出“指向下一页的链接”，WebHarvyWebScraper就会自动从所有页面抓取数据.

　　基于关键字的抓取

　　通过自动提交搜索表单的输入关键字列表来获取数据. 可以将任意数量的输入关键字提交到多个输入文本字段以执行搜索. 可以提取所有输入关键字组合的搜索结果数据.

　　通过代理服务器

　　为了匿名爬网并防止Web爬网软件被Web服务器阻止，您可以选择通过代理服务器或V PN访问目标网站. 您可以使用单个代理服务器地址或代理服务器地址列表.

　　类别提取

　　WebHarvyWebScraper允许您从链接列表中获取数据，从而在网站上产生相似的页面/列表. 这样一来，您就可以使用一种配置来抓取网站中的类别和子类别.

　　正则表达式

　　WebHarvy允许您在网页的文本或HTML源代码上应用正则表达式（RegEx），并删除匹配的部分. 这项强大的技术可让您在捕获数据时拥有更大的灵活性.

　　运行JavaScript

　　在提取数据之前，在浏览器中运行您自己的JavaScript代码. 它可用于与页面元素进行交互或调用已在目标页面中实现的JavaScript函数.

　　下载图片

　　您可以下载图像或提取图像URL. WebHarvy可以自动提取显示在电子商务网站的产品详细信息页面上的多个图像.

　　浏览器自动交互

　　可以轻松配置WebHarvy以执行任务，例如单击链接，选择列表/下拉选项，在字段中输入文本，滚动页面等.

　　安装教程

　　1. 下载并安装SysNucleus WebHarvy

　　2. 安装完成后，将Crck文件夹中的WebHarvy.exe复制到安装目录并替换

　　3，破解完成了

0

2020-08-07

免费网页采集器

0 个评论

要回复文章请先登录或注册