WebHarvy 5网页数据采集器中文破解版v5.3.1绿色版
优采云 发布时间: 2020-08-07 06:13尽管存在降低采集网页权利的风险,但是正确采集网页不是问题. 快来下载WebHarvy绿色版本,以帮助您进行数据采集. 它是功能强大的可视化专业Web数据采集软件. 您可以使用该软件直接选择要在网页上采集的资源,同时,它可以将整个网页保存为html格式,从而提取网页中的所有文本和图标内容. 该软件还可以自动提取文本,图片,URL和电子邮件等. WebHarvy可以将正则表达式(正则表达式)应用于文本或网页的HTML源代码,并提取要匹配的部分. 爬行数据时,这项强大的技术可以提供更大的灵活性. 有需要的朋友请下载WebHarvy破解版,然后开始采集所需的数据.
软件功能
从多个页面中提取
通常,网页在多个页面上显示数据,例如产品目录. WebHarvy可以自动从多个网页中提取数据. 刚刚指出“链接到下一页,WebHarvy网站抓取工具将自动从所有页面抓取数据.
基于关键字的提取
基于关键字的提取使您可以捕获从搜索结果页面输入的关键字的列表数据. 挖掘数据时,将为所有给定的输入关键字自动重复创建的配置,并且可以指定任意数量的输入关键字.
由{pass} {filter}服务器获取
要提取匿名信息并防止提取Web服务器,您必须通过代理访问目标网站. 您可以使用单代{pass} {filter}服务器地址或{pass} {filter}服务器地址列表生成.
提取分类
WebHarvy网站抓取工具使您可以从链接列表中提取数据,以在网站上生成相似的页面. 这样一来,您就可以使用一种配置来抓取网站中的类别或栏.
使用正则表达式提取
WebHarvy可以将正则表达式(正则表达式)应用于文本或网页的HTML源代码,并提取要匹配的部分. 这项强大的技术为捕获数据提供了更大的灵活性.
视觉点击界面
WebHarvy是一个可视化的Web提取工具. 绝对不需要编写任何脚本或代码来提取数据. 使用WebHarvy的内置浏览器浏览网络. 您可以选择单击鼠标提取数据. 很简单.
智能识别模式
自动识别网页上显示的数据模式. 因此,如果您需要从网页中删除项目列表(名称,地址,电子邮件,价格等),则不需要其他配置. 如果重复数据,WebHarvy将自动对其进行刮擦.
导出捕获的数据
可以保存从网页提取的各种格式的数据. 当前版本的WebHarvy网站抓取工具允许您将临时数据导出为XML,CSV,JSON或TSV文件. 您还可以抓取数据并将其导出到SQL数据库.
软件功能