优采云采集器(网页数据采集器)V7.62 官方免费版

优采云 发布时间: 2020-08-26 23:48

  优采云采集器(网页数据采集器)V7.62 官方免费版

  SysNucleus WebHarvy是一款网页数据抓取工具,拥有手动检查模式,可提取多个页面的数据,并将其导入到数据库或文件夹中。WebHarvy中支持运行JavaScript和表达式,让你可以灵活抓取数据,需要的同学赶快下载吧!

  

  WebHarvy 特点

  点击界面

  WebHarvy是一个视觉网路刮板。绝对不需要编撰任何脚本或代码来抓取数据。您将使用WebHarvy的外置浏览器浏览网页。您可以选择要点击的数据。这很容易!

  自动模式检查

  WebHarvy手动辨识网页中发生的数据模式。因此,如果您须要从网页上刮取项目列表(名称,地址,电子邮件,价格等),则无需执行任何其他配置。如果数据重复,WebHarvy会手动删掉它。

  导出抓取的数据

  您可以以多种格式保存从网页中提取的数据。WebHarvyWebScraper的当前版本容许您将抓取的数据导入为Excel,XML,CSV,JSON或TSV文件。您也可以将抓取的数据导入到SQL数据库。

  从多个页面提取数据

  通常,网页在多个页面上显示产品列表等数据。WebHarvy可以手动抓取并从多个页面提取数据。只需强调“链接到下一页”,WebHarvyWebScraper都会手动从所有页面中抓取数据。

  基于关键字的Scraping

  通过手动递交搜索表单的输入关键字列表来抓取数据。任何数目的输入关键字可以递交给多个输入文本数组来执行搜索。可以提取所有输入关键字组合的搜索结果数据。

  通过代理服务器

  为了匿名抓取并避免网路抓取软件被网路服务器制止,您可以选择通过代理服务器或V PN访问目标网站。可以使用单个代理服务器地址或代理服务器地址列表。

  类别提取

  WebHarvyWebScraper容许您从链接列表中获取数据,从而造成网站中出现类似的页面/列表。这让您可以使用单一配置来刮取网站内的类别和子类别。

  正则表达式

  WebHarvy容许您在网页的文本或HTML源代码上应用正则表达式(RegEx)并删掉匹配的部份。这种强悍的技术为您提供更多的灵活性,同时抓取数据。

  运行JavaScript

  在提取数据之前在浏览器中运行您自己的JavaScript代码。这可以拿来与页面元素交互或则调用早已在目标页面中实现的JavaScript函数。

  下载图片

  可以下载图象或则提取图象URL。WebHarvy可以手动提取电子商务网站的产品详尽信息页面中显示的多个图象。

  自动浏览器交互

  WebHarvy可以很容易地配置执行任务,如点击链接,选择列表/下拉选项,输入文本到一个数组,滚动页面等。

  安装教程

  1、下载并安装SysNucleus WebHarvy

  2、安装完成后将Crck文件夹中的WebHarvy.exe复制到安装目录中替换

  3、破解完成

  展开所有内容 ↓

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线