根据关键词文章采集系统(最好可以允许复制,但可以在IE内核的浏览器中实现)
优采云 发布时间: 2021-09-25 07:15根据关键词文章采集系统(最好可以允许复制,但可以在IE内核的浏览器中实现)
最好的用户体验是您可以允许复制,但我们可以为复制的内容添加版权信息。许多这种方法网站已经开始使用。
具体方法是:找到系统后台-模块-默认模块管理-文章页面模板并添加如下代码,你可以试试,在IE内核浏览器中,复制内容时可以自动添加版权信息网页功能!
JavaScript 代码:
二、 使文章页面无法复制代码
在系统后台的默认模块管理中找到footer.htm,或者文章页面模板的底部代码模块,在页面文件末尾添加如下代码,并保存。
另外,禁用复制功能也是很多人用来防止复制和反采集的方法。对于这种反采集文章,只能在“查看源文件”中使用他的采集。@文章内容已上。不过,破解的方法已经很多了。俗话说有政策有对策,但它起到了给抄袭者制造麻烦的作用,并不是每个人都学会了“破解方法”,所以我还是建议大家使用反抄袭策略。
三、使用反采集代码
其实普通的采集工具一般都要求内容起始码和结束码的唯一性。所以我们可以从 文章 页面开始
添加一段id="{dede:field.id/}",让文章自动获取文章 ID,如下图:
这样每个文章的ID都不一样,所以当采集tools采集时,一次只能采集一个文章,然后可以有效防止低级的采集工具采集,但是高级的采集工具未必能阻止!
四、设置DEDE自己的反采集字符串
DEDE自带反采集字符串的功能。通过设置反采集字符串,可以让其他采集文章出现散乱的字符串,影响阅读,这样采集的网站就不得不放弃采集。
防止设置采集混串管理后,可以增加或减少采集后显示的内容。一般可以参与一些版权声明或者你的网站相关信息,设置方法只需要参与“#start#”和“#end#”之间的内容,在前面加上“#”每个内容,一个内容为一行,里面的内容会随机插入到生成的html中。您可以按照下图停止设置。
当然,这并非万无一失。这是一个很高的。如果反采集的字符串比较少,你可以用一小套采集规则替换那些无意义的字符串。; 如果有很多字符串,这会稀释 文章 的密度。
另外,也有人建议直接使用网站关键字和网站链接作为字符串。据说这样可以增加网站的外部链接。采集 获得的人越多,外部链接就越多。马海翔对这种做法持保留态度。毕竟,设置反采集字符串与SEO作弊非常相似。所以目前很多网站都没有设置这个功能,不知道是不是这个原因。
五、封印者的IP采集
为了防止采集,大部分方法都是“双刃剑”,采用IP封锁来防止采集不成功返回。实践证明,这种方法绝对不会影响搜索收录。
具体代码如下:
0 那么
response.write “您的 IP 被禁止”
响应结束
万一
%>
指示:
把上面的代码放在上面就行了!
IPString="|45.125.14.95|183.56.168.84|127. 0.0.1|120.55.38.50|47.90.121. 181|" 是采集你的网站内容的垃圾邮件服务器的IP,可以自己替换,如果不知道对方服务器的IP,可以点击开始运行-input ping *****.com (采集网站 的 URL) 获取其 IP。
另外,127.0.0.1是防止本地采集,你可以在本地试试,因为现在很多新的网站都是来自本地的采集 @采集,所以这127.0.0.1 必须屏蔽。现在很多网站程序都有IP屏蔽功能,上面的代码就不用了,直接屏蔽它的服务器IP就好了!
六、防止文章成为采集的一些简单方法
除了上面的方法,我还整理了下面这些手头可以实现的方法。我觉得还是有一定的效果的。现在我将与您分享:
1、添加水印
当你的文章中有图片时,记得给文章中的图片加水印,这样就剩下你的版权了,对方想采集你的文章@ >之后就不可能一一去PS了。这可以看作是帮助我们变相宣传网站。
2、穿插信息
在写文章的时候,尽量随机插入一些你的网站姓名、链接、作者等信息,只要能流畅阅读,尽量多加。如果对方想要采集你的文章,他也会花很多时间去处理。久而久之,他就不愿意采集我们的文章。同时,对于粗心的采集人来说,它留下了你的信息。
3、留在链中
适当的给你的内容添加一些内链,但不要添加太多,不要超过3个(具体可以参考马海翔的博客“如何布局内链结构”相关介绍)。
4、 暂时留下错误
这个方法非常巧妙。如果你发现有站正在盯你,你应该每天定期采集你的文章内容。你可以在发布文章时故意写错或添加一些不好的词汇。代码类型可以是几行代码错误。看到他采集后,快点。改变它,这样它就可以降低他的用户体验。但是,我想提醒您,这种方法是不推荐的。万一你的用户此时看到你的文章,也会对你产生影响,所以这种情况只适合刚入门的人。访问较小的 网站。
该方法的具体方法是在文章的每个段落的任意位置添加一些无用字符,然后将这些字符的颜色设置为白色,并将这些字符的大小设置为0。
代码显示如下:
/ ^!|7 c; i1 T" x1 Q$ X1 \) G) C
这种方法可以防止软件轻易采集到他的文章内容。
其实很多人都用他的网站 URL,而不是用无用的字符。这样,当你复制他的文章并直接发布时,你会带上他的网址给他网站添加外部链接。
所以遇到这样的反采集网站、采集需要手动删除这些多余的字符。
但是,在这样防止采集的同时,文章也有很多无用的字符,不利于文章的SEO优化。
5、网址提交
先把写好的文章 URL提交给百度,两天后发布文章。这时候百度可能有收录你的文章。就算对方再次来采集,也不会有这么大的影响(详情请参考马海翔的博客《如何快速采集的文章内容< @收录 和排名”相关介绍)。
6、重要内容设置会员访问限制
如果你的网站里面确实有重要的内容,一定要预留,这样固定的资源才能吸引固定的用户。这样就可以设置会员访问限制,让注册会员或者高级会员可以访问这部分内容。
当然,这也会将搜索引擎拒之门外,但为了保持网站的吸引力,必须保留适当的稀有资源。如果网站没有用户留下的资源,那么用户很容易离开。
当然,防止采集的方法有很多,大家可以去专业网站学习模仿。马海翔认为,如果是新网站,打算通过原创的内容增加权重,要防止采集;如果网站发展的比较大,防止采集也没太大必要,毕竟搜索引擎已经认识到这是文章的起点。
最后提醒大家,因为每个网站根据使用时间和布局可能会在一些系统模板代码上略有差异,建议修改前保存一份源代码,以免误操作错误。操作导致整个网站丢失。
马海翔的博客评论:
事实上,无论技术和方法多么巧妙,也不能100%防止原创文章被他人抄袭。只能说是有一定的效果,就是增加了对方的工作量。最有效的方法是让每个人都遵守规则。要么原创自己动手,要么就转载文章并保留文章的出处,或者做一个*敏*感*词*的伪原创。对于现在的网络氛围,我觉得这种抄袭还需要很多年才能减少,而且真的很难根治。