智能采集发布器最新推出中文核心页面的录入方法!

优采云 发布时间: 2021-04-27 22:09

  智能采集发布器最新推出中文核心页面的录入方法!

  智能采集发布器最新推出很多采集器不能采集的元素,今天小编为大家整理了中文核心页面的录入方法。目前很多站长用的采集器都是实时计算速度的,并不是根据系统内容的完整性来调整每个元素的速度,往往从前端查询到数据出来到产生结果需要一定的时间,过长的时间就可能会影响系统每秒的请求数。所以每个采集器查询的时候都会有个准确时间,这个准确时间一般都比较长,往往需要等待分析服务器的响应。

  下面介绍一种方法可以快速的查看某个sitemap所有的页面,这是一种人工查询的方法,没有什么限制。首先我们先把页面存到一个vml中去做权重。然后进入dws,把需要的页面导入到dws中,并且有robots.txt这个rule.它是页面权重不对应网页名下,比如如果页面名是中文,可以把页面名用拼音命名,和不是中文字符的字母命名。

  新建一个fields配置页面需要用到的关键字,并把你需要的关键字itemcopy到fields中去配置即可。在fields中输入a{textonly}b{textonly}c{textonly}d{textonly}e{textonly}f{textonly}g{textonly}h{textonly}i{textonly}itemcopy页面中的关键字。

  override然后存到vml中就可以查看你需要的页面了。至于计算速度,一般的采集器速度都比较慢,一般要查几百万网页才能使用这个方法,像,这些地方不仅数据会丢失,而且速度会很慢。基本上可以作为提高网站速度的一个方法,建议大家使用v5来采集所有页面。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线