网页css js 抓取助手(Screaming优化蜘蛛最常见的用途和使用方法有哪些?)
优采云 发布时间: 2022-01-04 00:07网页css js 抓取助手(Screaming优化蜘蛛最常见的用途和使用方法有哪些?)
Screaming Frog SEO Spider 是一款专业的网站 资源检测和搜索工具。该软件支持爬取网站并查找损坏的链接(404)和服务器错误,审计)是一个非常有用的网站优化和SEO工具,用于定位、发现重复内容、分析页面标题和元数据。Screaming Frog SEO Spider可以查找断链、查看重定向、分析页面标题和元数据、查找重复内容、使用XPath提取数据、查看机器人和指令、生成XML站点地图等功能,软件界面非常简单明了,软件使用方便快捷。
如何使用
一、爬行爬行
1、定期爬取
在正常爬取模式下,Screaming Frog SEO Spider 13 破解版会爬取您输入的子域,并将遇到的所有其他子域默认视为外部链接(显示在“外部”选项卡下方)。在正版软件中,可以调整配置选择抓取网站的所有子域。搜索引擎优化蜘蛛最常见的用途之一是在 网站 上查找错误,例如断开的链接、重定向和服务器错误。为了更好的控制爬取,请使用您的网站 URI结构,SEO蜘蛛配置选项,比如只爬取HTML(图片、CSS、JS等)、排除函数、自定义robots.txt、收录函数或者更改搜索引擎优化蜘蛛模式,上传一个URI列表爬取
2、抓取一个子文件夹
SEO Spider 工具默认从子文件夹路径向前爬取,所以如果要爬取站点上的特定子文件夹,只需输入带有文件路径的 URI。直接进入SEO Spider,会抓取/blog/sub目录下的所有URI
3、获取网址列表
通过输入网址点击“开始”抓取网站,您可以切换到列表模式,粘贴或上传要抓取的特定网址列表。例如,在审核重定向时,这对网站迁移特别有用
二、配置
在该工具的行货版本中,可以保存默认的爬取配置,并保存需要时可以加载的配置配置文件
1、要将当前配置保存为默认值,请选择“文件>配置>将当前配置保存为默认值”
2、要保存配置文件以便以后加载,点击“文件>另存为”并调整文件名(描述性最好)
3、要加载配置文件,请点击“文件>加载”,然后选择您的配置文件或“文件>加载最近”从最近列表中选择
4、要重置为原版Screaming Frog SEO Spider 13破解版的默认配置,请选择“文件>配置>清除默认配置”
三、导出
顶部窗口部分的导出功能适用于您在顶部窗口中的当前视野。因此,如果您使用过滤器并单击“导出”,则只会导出过滤器选项中收录的数据
主要有三种数据导出方式:
1、导出顶层窗口数据:只需点击左上角的“导出”按钮,即可从顶层窗口选项卡导出数据
2、导出下层窗口数据(URL信息、链接、输出链接、图片信息):导出这些数据只需在上层窗口中要导出的数据的URL上右击,然后点击“导出”下的“URL信息”、“链接”、“外链”或“图片信息”
3、 批量导出:位于顶部菜单下,允许批量导出数据。您可以通过“all in links”选项导出在抓取中找到的所有链接实例,或导出所有链接到具有特定状态代码(例如 2XX、3XX、4XX 或 5XX 响应)的 URL。例如,选择“链接中的客户端错误 4XX”选项将导出所有链接到所有错误页面(例如 404 错误页面)。您还可以导出所有图片替代文本,所有图片缺少替代文本和所有锚文本
下载链接: