解决方案:怎么通过CSS选择器采集网页数据

优采云 发布时间: 2022-12-06 01:39

  解决方案:怎么通过CSS选择器采集网页数据

  按 F12 打开开发人员工具并查看文章列表 HTML 代码结构:

  文章标题可以通过 CSS selector.post-item-title 获取;

  文章地址可以通过 CSS selector.post-item-title 获取

  文章介绍可以通过 CSS selector.post-项目摘要获得;

  作者可以通过CSS选择器.post-item-author获取它;

  用户头像可以通过CSS选择器img.avatar获取;

  这

  点赞数可以通过CSS获得 selector.post-项目-英尺 a.post-元项目;

  注释的数量可以通过 CSS 获得 selector.post-item-foot a[class*=post-meta-item]:nth-of-type(3);

  视图数可以通过 CSS 获得 selector.post-item-foot a[class*=post-meta-item]:nth-of-type(4) span;

  所以现在开始编写采集规则,采集保存规则,进入页面检查数据当前是否采集。

  {

"title": "云海天首页文章列表",

"match": "https://www.cnblogs.com/*",

"demo": "https://www.cnblogs.com/#p2",

"delay": 2,

"rules": [

{

"root": "#post_list .post-item",

"multi": true,

"desc": "文章列表",

"fetches": [

{

"name": "文章标题",

"selector": ".post-item-title"

},

{

"name": "文章地址",

"selector": ".post-item-title",

"type": "attr",

"attr": "href"

},

<p>

{

"name": "文章介绍",

"selector": ".post-item-summary"

},

{

"name": "作者",

"selector": ".post-item-author"

},

{

"name": "头像",

"selector": "img.avatar",

"type": "attr",

"attr": "src"

},

{

"name": "点赞数",

"selector": ".post-item-foot a.post-meta-item"

},

{

"name": "评论数",

"selector": ".post-item-foot a[class*=post-meta-item]:nth-of-type(3)"

},

{

"name": "浏览数",

"selector": ".post-item-foot a[class*=post-meta-item]:nth-of-type(4)"

}

]

}

]

}

</p>

  编写规则采集内容页

  编写方式与上面相同,代码直接发布在这里。

  

  {

"title": "云海天文章内容",

"match": "https://www.cnblogs.com/*/p/*.html",

"demo": "https://www.cnblogs.com/bianchengyouliao/p/15541078.html",

"delay": 2,

"rules": [

{

"multi": false,

"desc": "文章内容",

"fetches": [

{

"name": "文章标题",

"selector": "#cb_post_title_url"

},

{

"name": "正文内容",

"selector": "#cnblogs_post_body",

"type": "html"

}

]

}

]

}

  添加计划任务(实现批量采集、翻页采集)。

  生成 URL 采集地址帮助文档

  在定时任务中,通过动态URL获取采集文章页面的地址采集地址,获取完成后插件会自动打开对应的页面。一旦打开页面,插件就会匹配采集规则并采集数据。

  https://www.cnblogs.com/

[a.post-item-title,href]:https://www.cnblogs.com/#p[2,10,1]

  预览数据

  原文链接:

  解决方案:5个常用的SEO工具助力网站获得Google自然搜索流量

  SEO(Search Engine Optimization,搜索引擎优化)一直是跨境卖家获取流量的重要策略之一。通过调整网站的结构、内容、分析数据等,可以使我们的网站在搜索引擎上的排名更高,获得更多的免费流量。

  在分析网站性能和数据的时候,需要用到各种工具,所以这次我挑选了5款我们正在使用的免费SEO工具来介绍给大家。

  工具 1:Screaming Frog ─ 查找有问题的页面

  你可能听说过,当网站中有​​多个页面出现问题(例如404错误、页面不存在等)时,会导致排名下降。当网站页*敏*感*词*有一定的规模时,我们几乎不可能进行人工检查。

  而网站爬虫软件Screaming Frog可以帮助我们找到问题页面进行补救,包括404页面、跳转页面、站外链接、无效图片、标题关键词等概览相关问题。

  尖叫青蛙免费版可以免费抓取500个页面,适合小规模网站,您可以根据需要过滤需要特别关注的页面,但是如果您的网站超过500个页面,你应该考虑支持正版。

  工具 2:MozBar ─ 了解对手的 网站 权限

  Moz 是一个著名的 SEO 工具,并且是第一家提出 网站 域权限 (DA) 值的公司。DA可以说是展示了一个网站在搜索结果中排名靠前的概率,DA的计算受到很多因素的影响,包括根域(Root Domain)和链接数。

  MozBar 是 Moz 提供的免费工具。安装它的Chrome插件(Plugins)后,你可以很方便地查看自己和对手的网站权限(Domain Authority,DA)和页面权限(Page Authority,PA)。

  

  一般来说,大媒体网站和政府网站的DA会比较高,但是我们的目标不是追求100DA分,只要你的DA比你的对手高,也就是你的网站 更有可能在搜索结果中排名更高。

  不过DA毕竟是Moz计算出来的分数,并不是Google官方提供的数字,所以仅供参考。

  工具三:Google Search Console - 了解 网站 搜索性能

  Google Search Console 是 Google 官方提供的一款免费工具。主要帮助您监控网站搜索结果排名、关键词和点击率。使用这个工具还可以帮助谷歌这个搜索引擎(Search Engine)更好地了解你网站,它的特点包括:

  工具四:Google Analytics ─ 了解 网站 整体表现

  和Google Search Console一样,也是Google旗下的一款网站分析工具,可以说是网站最基础的工具了。从基本了解网站的浏览量、用户数、用户来源等有用信息,也可以进行更深层次的用户行为追踪(包括设定目标、使用UTM追踪等) .).

  在5个工具中,这个可以说是第一个,也是必备的一个。我们遇到过很多想做SEO的客户,但是在网站上线的前几年没有安装GA,导致很多宝贵的可用分析数据丢失了。

  安装GA并没有大家想象的那么难。如果您使用的是WordPress平台,您可以安装一个插件,按照简单的步骤即可完成设置。如果你是自建网站,建议找你负责的网站技术人员来做。

  

  工具五:相似网─分析对手的表现

  在做搜索引擎营销的时候,我们往往想了解竞争对手的表现,从而了解自己在行业中的表现。其中,有免费工具可以让我们查看网站流量及其来源。

  Similar Web免费版可以看到对方的

  但目前Similar Web只能显示流量较大的网站数据。如果你的竞争对手有高流量网站(比如媒体),你可以使用这个工具来大致了解他们的表现。

  如果你想查询的网站在Similar Web上的流量太低,你也可以使用SE Rankings来查看。

  但请注意,在使用这些工具时,根据我们以往的经验,流量数字并不准确(可能高估或低估),所以在使用这些工具时,可以注意观察对方的流量趋势(是否是上升还是下降),其他流量构成(是自然流量还是从社交平台带来的流量)等等,然后和自己的流量趋势和构成进行比较,而不是简单的看数字。

  希望以上内容能够对刚开始做SEO工作的朋友有所帮助。除了上述工具,我们还使用其他有偿工作进行 SEO 工作。以后有机会再跟大家分享。

  木瓜移动是Facebook和谷歌在中国的顶级代理。服务团队由拥有10年投放经验的媒体购买团队和Facebook、Google政策解读辅助团队组成。服务行业包括:游戏、电商(含中小电商)、APP、品牌等。公司自成立以来,实现了跨越式发展,与众多优秀企业建立了长期合作关系,成功帮助广告商和应用开发商开拓海外市场。

  相关文章:Google SEO教程:从跨境电商单机获得自然流量 Google Shopping宣布对所有商家开放!谷歌SEO教程:跨境电商单站自然流量——结构化数据跨境推广必备专业营销术语

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线