关键句采集 原创( 一下昨天测试成功的一款插件,先上一个演示链接!)
优采云 发布时间: 2022-04-14 22:05关键句采集 原创(
一下昨天测试成功的一款插件,先上一个演示链接!)
今天给大家分享一个昨天测试成功的插件。首先,一个演示链接:
开发这个插件的原因是有的朋友想要这种聚合文章,所以陶小白用自己的规则测试,测试还可以,整体标题+内容聚合,没有很突兀地方,说一下具体的实现逻辑。
1、支持规则,标题搜索词采集规则
头条搜索词采集规则用了很久,很多朋友反馈很好,并且不断升级更新。需要此规则的朋友可以联系。
这条规则采集的内容是今日头条信息下的文章,所以在今日头条站都是文章,而不是综合信息下的文章。
2、标题原创,双标题
双标题在智能版本中仍然使用。可以通过关键词进行扩展,相关的关键词可以组合成标题。标题的相关词源可以自定义,因为有的朋友喜欢头条,有的朋友喜欢百度的。目前可以自定义这两个平台的关联和下拉。如果您需要其他平台的相关词,您需要详细查看它们。
3、内容聚合
采集在规则搜索词之后,直接爬下一个列表中的十篇文章文章,然后对这部分数据进行简单的处理,然后将数据传给插件,然后插件会根据P标签进行二次处理。过滤,过滤合格的p标签,等待插件处理,处理完一个文章后,插件开始重写内容,重写完成后存储,就这样, for 10 文章 > 清理、过滤、重写和存储。完成后统一返回到指定标签,这样数据就被清洗干净,最后通过发布模块发布到自己的网站。
4、标题和内容字数自定义
因为有客户对标题字数有限制,比如有多少字不在下面,这个功能是后面加的。可以自定义相关词的词数,也可以限制聚合内容的词数。建议在300-500之间。.
5、根据条目数自定义列表
10篇文章的列表文章,我们也可以自定义文章数,比如我想只用5篇,这个也可以实现,可以在采集规则中实现。
因为该插件匹配标题搜索词的规则,所以目前比较稳定,可以长时间输出数据。如果你想把这个规则和其他平台的规则进行匹配,是可以的,但是需要注意几个问题。
有需要的朋友,想要购买这个插件的朋友,可以联系站长询问价格。不打算付费的朋友请勿打扰,谢谢~