免费网页采集器(SysNucleusWebHarvy的网页数据采集软件特色介绍)

优采云 发布时间: 2021-09-12 04:01

  免费网页采集器(SysNucleusWebHarvy的网页数据采集软件特色介绍)

  SysNucleus WebHarvy 是一款非常好用的网页data采集软件,可以帮助用户轻松地从网页中提取数据,并以不同的格式保存。还支持提取视频、图片等各类文件。

  

  [软件功能]

  1、SysNucleus WebHarvy 允许您分析网页上的数据

  2、 可以显示和分析来自 HTML 地址的连接数据

  3、可以扩展到下一个网页

  4、可以指定搜索数据的范围和内容

  5、您可以下载并保存扫描的图像

  6、支持浏览器复制链接搜索

  7、支持配置搜索对应资源项

  8、可以通过项目名和资源名搜索

  9、SysNucleus WebHarvy 可以轻松提取数据

  10、提供更高级的多词搜索和多页搜索

  

  【软件功能】

  轻松的网页抓取:WebHarvy 的点击式界面使网页抓取变得容易。绝对不需要编写任何代码或脚本来抓取数据。您将使用WebHarvy 的内置浏览器加载网站,您可以通过单击鼠标选择要提取的数据。就是这么简单! (视频)

  智能模式检测:自动识别网页中出现的数据模式。因此,如果您需要从网页中获取项目列表(姓名、地址、电子邮件、价格等),则无需进行任何其他配置。如果数据重复,WebHarvy 会自动抓取它。保存到文件或数据库

  您可以以多种格式保存从网站提取的数据。当前版本的 WebHarvy 网络搜索软件允许您将提取的数据保存为 Excel、XML、CSV、JSON 或 TSV 文件。您还可以将捕获的数据导出到 SQL 数据库。 (了解详情)

  获取多个页面:网站 通常在多个页面上显示产品列表或搜索结果等数据。 WebHarvy 可以自动抓取网络并从多个页面中提取数据。只需指出“加载下一页的链接”,WebHarvy Web Scraper 就会自动从所有页面中抓取数据。 (了解详情)

  提交关键字:通过自动提交输入关键字列表来搜索表单来擦除数据。可以将任意数量的输入关键字提交到多个输入文本字段以执行搜索。可以从所有输入关键字组合的搜索结果中提取数据。 (了解详情)(视频)

  隐私保护:为了匿名抓取,防止网页抓取软件被网页服务器拦截,您可以选择通过代理服务器或VPN访问目标网站。可以使用单个代理服务器地址或代理服务器地址列表。 (了解详情)

  类别抓取:抓取工具允许您从链接列表中抓取数据,这些链接将指向网站 中的类似页面/列表。这允许您使用单个配置来抓取网站 内的类别和子类别。 (了解详情)(视频)

  常用表达式:允许您在网页的文本或 HTML 源代码上应用正则表达式 (RegEx) 并抓取匹配的部分。这种强大的技术在您抓取数据时提供了更大的灵活性。 (了解更多)(RegEx 教程)

  JavaScript 支持:在提取数据之前,请在浏览器中运行您自己的 JavaScript 代码。它可用于与页面元素进行交互、修改 DOM 或调用已在目标页面中实现的 JavaScript 函数。 (了解详情)

  图片提取:您可以下载图片或提取图片网址。 WebHarvy 可以自动提取显示在电子商务网站产品详情页面中的多张图片。 (了解详情)

  自动化浏览器任务:WebHarvy 可以轻松配置为执行任务,例如单击链接、选择列表/下拉选项、在字段中输入文本、滚动页面、打开弹出窗口等。

  技术支持:购买 WebHarvy 后,您将在购买之日起 1 年内获得我们的免费更新和免费支持。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线