内容采集(采集飞天券网站为例介绍如何使用该魔法采集(组图))

优采云 发布时间: 2021-09-07 06:02

  内容采集(采集飞天券网站为例介绍如何使用该魔法采集(组图))

  部分导购没有内页,需要直接从列表页采集内容单独发布。针对这种情况,添加魔法采集:从列表页面抓取内容。

  以下以采集飞天票网站为例,介绍采集魔术的使用方法。

  采集Tutorial 获取列表内容并输入列表地址

  

  填写采集的列表地址设置magic采集

  

  设置魔法采集

  item选择器的获取方法如下图所示。只需选择 1 项即可获取其选择器:

  

  标题选择器的作用是和文章保存的标题进行比较,判断这个是否已经是采集,获取方法同上:

  

  也许你会奇怪,为什么这里的选择器和之前的设置图不一样?上一个是 .info-title 而不是 .item-info .info-title a,那是因为采集这个标签选择器会自动清除采集到达的HTML标签,a标签被自动过滤掉,所以这两种写法的效果是一样的。

  这样就可以得到每个item的HTML代码了。下面是从这些HTML代码中获取内容。

  采集特*敏*感*词*片,标题和内容设置特*敏*感*词*片

  

  设置标题选择器和内容选择器

  

  我在这里直接为内容选择器选择了最外面的标签。事实上,我很懒惰。正确的做法是将每个参数采集放在自定义列中,然后格式化输出。文末会介绍如何采集Go自定义列和格式化输出。

  测试采集

  OK,一切都设置好了,测试爬取链接:

  

  然后选择任何一个并测试采集:

  

  虽然内容有点乱,但还是很成功的。

  自定义列采集 和格式化输出将内容采集 到自定义列

  新建自定义栏目采集,采集导购链接,自定义栏目名称设置为buy-link,这是Meta Key。

  

  设置格式化输出

  

  这段代码的意思是在文章内容之后输出导购链接。之所以用shortcode输出链接,是因为链接的href里面不能有引号,而post-meta的shortcode里面有引号。

  结论

  采集网站 没有内页到此结束。如果您有兴趣,请过来尝试一下。还没有购买的朋友欢迎访问:QQWorld采集器

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线