网页抓取工具(Screaming优化蜘蛛最常见的用途和使用方法有哪些?)

优采云 发布时间: 2021-09-15 10:17

  网页抓取工具(Screaming优化蜘蛛最常见的用途和使用方法有哪些?)

  Scraming frog SEO spider是一款专业的网站资源检测和搜索工具。该软件支持捕获网站并查找断开的链接( 404)和服务器错误、审核重定向、查找重复内容、分析页面标题和元数据等都是网站优化和SEO非常有用的工具;screening frog SEO spider具有查找断开链接、审核重定向、分析页面标题和元数据、查找重复内容、使用XPath提取数据的功能,查看机器人和指令,生成的软件界面非常简单清晰,软件使用方便快捷

  

  使用方法

  一、爬行抓斗

  1、常规抓斗

  在正常爬行模式下,爬行青蛙SEO spider 13破解版将爬行您输入的子域名,并将默认情况下遇到的所有其他子域名视为外部链接(显示在“外部”选项卡下)。在该软件的许可版本中,您可以调整配置以选择网站的所有子域。搜索引擎优化蜘蛛最常见的用途之一是查找网站上的错误,例如断开的链接、重定向和服务器错误。为了更好地控制爬网,请使用您的网站URI结构和SEO spider配置选项,如仅抓取HTML(图像、CSS、JS等)、排除功能、自定义robots.txt、收录功能或更改搜索引擎优化蜘蛛的模式,以及上载URI列表以抓取

  2、抓取一个子文件夹

  默认情况下,SEO spider工具从子文件夹路径向前爬行,因此如果您想在站点上爬行特定子文件夹,只需输入带有文件路径的URI。通过直接将其输入SEO spider,它将爬行/blog/sub目录中收录的所有URI

  3、grab URL列表

  通过输入URL并单击“开始”爬网网站,您可以切换到列表模式并粘贴或上载要爬网的特定URL列表。例如,在审核重定向时,这对于站点迁移特别有用

  二、配置

  在该工具的许可版本中,您可以保存默认爬网配置,并保存可在需要时加载的配置文件

  1、要将当前配置保存为默认配置,请选择文件>配置>将当前配置保存为默认配置

  2、要保存配置文件以便将来可以加载,请单击文件>另存为并调整文件名(最好是描述性的)

  3、若要加载配置文件,请单击“文件>加载”,然后选择您的配置文件或“文件>加载最近”以从“最近”列表中选择

  4、若要重置为原创筛选版本默认配置,请选择文件>配置>清除默认配置

  三、出口

  “顶部窗口”部分中的“导出”功能与顶部窗口中的当前视野配合使用。因此,如果使用过滤器并单击“导出”,则仅导出过滤器选项中收录的数据

  有三种主要的数据导出方法:

  1、导出顶级窗口数据:只需点击左上角的“导出”按钮,即可从顶级窗口选项卡导出数据

  2、export lower window data(URL信息、链接、输出链接、图像信息):要导出这些数据,只需右键单击顶部窗口中要导出的数据的URL,然后单击导出下的URL信息、链接、输出链接或图片信息

  3、批量导出:在顶级菜单下,允许批量导出数据。您可以通过“链接中的所有链接”选项导出爬网中找到的所有链接实例,或将所有链接导出到具有特定状态代码的URL(例如2XX、3xx、4xx或5xx响应)。例如,选择“链接中的客户端错误4xx”选项将导出所有错误页面的所有链接(例如404错误页面)。您还可以导出所有图像替代文本、所有缺少替代文本的图像和所有锚文本

  

  下载地址:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线