最新版本:网页自定义采集规则教程最新版

优采云 发布时间: 2022-12-25 02:11

  最新版本:网页自定义采集规则教程最新版

  其实写一个采集规则并不难,只要会css语法就不会去百度自己补了。 一般都是先采集榜单,然后通过榜单抓取详情页。 其实每个列表都有css规则来控制样式。

  这里推荐一个学习css选择器的网站:

  了解了选择器,你就会知道如何采集列表页和详情页。

  当然,你也学会了如何定义自己的网页风格,一举两得。 作为站长,学习还是很有必要的。

  以上是基础知识。 接下来,我们就来说说采集工具给我们带来的便利。 我是第一批使用采集的用户。 当时还没有自动存储多个分类的功能。

  这个功能用起来很酷。 我想采集一批资源,但是又不想放到一个分类里,所以只需要输入我要放入图书馆的分类id,然后采集就会随机放入这些类别。

  当然,如果你填写的category id文本框你是空的,那么它只会存储在采集分类下你选择的分类中。

  

  另一个特点是分页:

  估计有些人直接输入页码然后就认为该页被采集,提示很清楚!

  如果采集的页面是:,那么可以把“2”页码换成{#num},最后显示

  请记住,要替换采集URL 中的页码,请将其替换为 {#num}。

  这样采集不到的数据才能采集到,否则会重复,然后你会问为什么其他页面的数据没有采集。

  最后一个功能是自动采集,用起来很爽。

  采集时间间隔的单位是毫秒,1秒=1000毫秒。

  最好设置成2小时自动采集一次,毕竟网站更新不会那么频繁。

  自动采集的事情是每天都会更新采集你上面填写的URL地址的网页列表,也就是更新比较频繁的页面适合自动采集。 采集窗口不要关闭,在设定时间内会自动显示。 采集。

  

  管理员添加:

  规则文件存放位置:static/caiji,txt文件规则存放在caiji文件夹中。

  这是360问答的采集规则,每行一个,有就写,用'|'隔开如果不是,因为这是最后一次拆分。

  到此终于完成了一大半,剩下的就是配置了。 caiji文件夹下有个xml.php,打开:

  你能看懂吗,你txt的名字和键值对,注意','是英文的!

  那么下次在采集管理页面刷新网页时,就可以看到你新添加的采集规则了。

  好了,说了这么多,欢迎吐槽!

  解读:wordpress调用最新文章五种方法包括排除置顶文章

  无插件调用最新文章是我们在进行wordpress改造开发时经常会遇到的一个功能。 我们在网上采集了几种常用的方法。 当一个页面同时有最新文章和置顶文章时,我们必须考虑将它们排除在最新文章列表之外。 放下粘性文章。

  1.最简单的方法是wp_get_archvies

  WordPress最新文章的调用可以用一个非常简单的模板标签wp_get_archvies来实现

   (显示10篇最新更新文章)

  要么

  type=postbypost:按最新文章排序

  limit:限制文章数量为最新20篇

  format=custom:用于自定义本文章列表的显示样式(fromat=custom也可以省略,文章标题默认显示在UL列表中。)

  二、query_posts()函数

  也可以通过WP的query_posts()函数调用最新文章列表。 虽然代码会多一点,但是可以更好的控制Loop的显示。 例如,您可以设置是否显示摘要。 具体使用方法也可以查看官方说明。

  调用最新文章:(直接把下面代码放在你要呈现的位置即可)

    

    最新文章  

      

      

          

          

       

  阅读 6文章,不包括类别 ID 为 111 的文章

  3.推荐WP_Query函数

  

</a>

  4.推荐get_results()函数

  

”></a>

  5.从最新文章中排除热门文章

<p>最新文章

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线