网站内容抓取工具(URLExtractor支持网址抓取及链接提取,使用方便的功能介绍)
优采云 发布时间: 2022-03-07 11:13网站内容抓取工具(URLExtractor支持网址抓取及链接提取,使用方便的功能介绍)
URL Extractor 是一个 URL 提取工具。URL Extractor 支持 URL 抓取和链接提取。它易于使用,可以帮助用户浏览所有文件夹和抓取网页链接。如有必要,可以下载它们。
特征
网址抓取器
有时我们需要从文件和文件夹中获取所有 URL(统一资源定位器)。浏览所有文件夹并抓取 Web 链接可能是一项艰巨的任务。幸运的是,当您需要 URL 抓取软件时,Vovsoft URL Extractor 可以帮助您。
链接提取器
Vovsoft URL Extractor 是可以采集 http 和 https 网址的最佳程序之一。您可以在几秒钟内从文件中提取和恢复所有 URL。安装后,您可以启动应用程序并几乎立即开始搜索链接。您只需要提供一个目录,其余的由程序处理。
该软件扫描整个文件夹以查找收录 URL 的文件,并将它们全部显示在其主窗口中,允许您将列表导出到文件中。所有选项一目了然,简单明了,都可以放在一个窗口界面中。您需要做的就是选择您希望应用程序分析的文件夹,然后按“开始”按钮。Vovsoft URL Extractor 还具有文件掩码和对正则表达式的支持,可帮助您过滤文件和 URL。
软件功能
1、支持提取email地址、web地址、ftp地址、feeds、telnet、本地文件url等。
2、拥有一个新的现代引擎,采用最新的可可和objective-c 2.0 技术。它从不冻结,甚至通过搜索引擎采集具有数百个关键字的数千个 URL。
3、可以导入和导出“URLs”和“Keywords”以便在他们的表格中导航和提取。使用一个很好的改进的导入引擎,它可以自动识别导入的格式,并在选择导入什么时提供很大的灵活性。
4、从磁盘(文件和文件夹)中无限数量的来源中提取 URL 和电子邮件,浏览任何指定文件夹和子文件夹的所有内容。在几秒钟内从数千个文件中提取。源列表接受文件和文件夹的拖放。
5、从您指定的 网站 列表中提取来自网络的 URL 和电子邮件。它开始提取您需要的 URL,并在无休止的导航过程中继续浏览在线找到的附加链接后根据需要采集 URL 或电子邮件。
6、从关键字列表中提取来自网络的 URL 和电子邮件。
它使用您指定的搜索引擎上可用的关键字列表,然后开始查找相关的 网站,然后开始使用相关的 网站 导航,同时跟踪找到的链接并采集所有 URL 或电子邮件。提供多个关键字,它可以提取数小时的相关(关键字)URL 和电子邮件。
7、使用 Bing 和 Google(18 个不同的 Google 区域网站:.com .it .fr. au .uk .de 和 .es .ar .au .at .be .br .ca .fi. nl.se.ch)。使用您指定的搜索引擎在网络上进行无限搜索。
8、支持从 safari 和其他 Web 浏览器中接受拖放 URL,以将它们用作从 Web 中提取的*敏*感*词*。
9、支持使用多个选项:“单域提取”仅从指定的网站中提取,而不跳转到链接的网站或“深度导航”指定从哪个级别提取site 跳转到链接的站点进行搜索和提取。
10、PDF提取,支持从本地或在线pdf文件提取。如果它在网上找到一个 PDF 并且它收录一个网页地址,它甚至可以跳转到该地址并继续搜索和提取网页。
扩张