汇总:文章防采集方案 (附图)

优采云 发布时间: 2022-12-23 21:37

  汇总:文章防采集方案 (附图)

  网络上的采集已成家常便饭,如何更好的保护自己网站的内容也成为各大网站考虑的重点

  SupeSite目前的功能还是比较不错的,只有一些小的地方需要改进

  然而,反采集网站内容并没有被列入发展议程……

  这里我提供一个解决方案供大家参考。

  

  我已经有全套的技术资料,可行性没有问题。 这个项目是2003年以前研究的,国内很少。

  本来打算自己开发的,但是因为依赖SS,而且它的部分代码是加密的,所以没法上手,所以希望官方能增加这个功能。

  (备注:该方案对搜索引擎的收录有一定的影响,毕竟FLASH中显示的是一些文字,而不是文字。可以使用FLASH中显示一点文字的方法,效果会更好。

  ECMS使用的是随机字符的方法,我没研究过,大家也可以参考一下)

  

  采集时代,有些人不搞采集

  有人收养人,也有人收养

  而真正的水平是能攻能守

  我们的目标是:SupeSite不能采集自己的网站(SS的采集功能很强,攻守兼备,哈哈哈……哈哈哈……)

  教程:织梦DedeCMS用优采云自动发布文章并更新HTMl

  DEDE利用有财优采云采集器实现的自动发布文章和实时更新HTML的功能。

  一、为什么会有这个想法:

  使用有优采云发布文章存在三大不足。

  需要登录才能发布,DEDE系统限制太大

  一次发布的数量是有限制的,可能会造成一次发布太多的后果。

  如果网站首页是一个静态文件,那么首页是无法更新的,用户也不知道网站的更新状态

  如果你没有一个可以一直运行的服务器,使用优采云采集器的自动更新功能是不切实际的

  优采云采集器的自动更新功能是收费的,呵呵。

  我需要它,我想挑战自己等等。

  二、做。

  首先,我觉得让优采云发布大量数据,将文章属性设置为未审状态,非常简单。 在使用DEDEv5.3.1的时候遇到了DEDE的一个bug。 前台显示的是未审核的文章。 先是骂DEDE,然后找了一些原因,发现DEDEv5.3.1有个bug。 修复后,前台无法显示未评论的文章。 1月13日向DEDE报错后,1月14日DEDE发布的patch修复了这个问题。哈哈,于是,1月15日,就这样,开始正式整理这份开发文档。

  实际发现,发布并保存大量未审文章不是问题,难点在于如何实现随机刺激发布的功能。 想了半天,我觉得还是用时间限制最好。 当前端JS调用评论文章的链接,传递一个用户的信息时,程序获取用户的IP,保存为session信息。 这时候评论一篇文章,生成文章和首页的静态文件。 一个用户在一定时间内只能激活有限数量的文章,发布的时候用的是用户的IP信息,呵呵,挺有个性的。

  

  激活文章,生成文章静态页面和首页静态文章可能会因为网站模板的影响比较慢,并且会出现页面还没生成就关闭首页的问题。 所以,最好的办法就是在文章文章的时候生成文章的静态文件,然后将文章设置为未审状态。 激活文章只需要一个简短的查询。 尽量在首页或列表页使用动态页面。 这两个问题不好处理,只能用这种方法代替。

  完整的流程是,在发布文档时,将文档设置为未审状态; 调用程序时,先判断上次查询的缓存是否超时,如果超过缓存时间,则清空缓存,显示最新的文章。 清空缓存后,查询一定数量的属性未审核的文档,取消Archives和Arctiny表中未审核的属性,更新文档的Pubdate字段,实现一点随机化。 最后写入缓存,缓存有效期内禁止重复更新!

  3.文件使用方法:

  发布文档时,请将文档属性设置为未审核状态,即发布时提交的文档属性参数为:arcrank=-1,此时为动态浏览;

  如果要生成静态文档,请将文档状态设置为正常浏览状态,即arcrank=0; 然后修改默认文档加法器。

  如:arcticle_add.php,在文件底部添加一段代码“//generate HTML”:

  //生成HTML

  插入标签($标签,$arcID);

  $artUrl = MakeArt($arcID,true,true);

  如果($artUrl==")

  {

  $artUrl = $cfg_phpurl."/view.php?aid=$arcID";

  }

  

  $dsql->ExecuteNoneQuery("UPDATE ` cms xx_archives` SET `arcrank`='-1' WHERE (`id`='$arcID');");

  $dsql->ExecuteNoneQuery("UPDATE ` cms xx_arctiny` SET `arcrank`='-1' WHERE (`id`='$arcID');");

  然后,将New.php上传到你的网站根目录,进入Dede后台设置系统的基本设置,在性能选项卡中将arclist标签的调用缓存时间设置为合适的数字,比如3600表示刷新缓存每小时一次。

  最后,只需调用模板文件顶部的一段代码:

  ” “。

  支持的参数:

  no=每次随机更新的次数,为空时默认5次;

  typeid=column ID,若为空则为全站数据

  order=排序方式,支持Desc:逆序,Asc:顺序,Rand:随机,默认随机查询。

  如:” ”

  当排序为Desc时,按照先发表的文章先评论的方式发布,否则Asc,Rand随机。

  第四,这是在数据处理上的一次尝试,或许这种新模式会是一个突破口。 祝您使用愉快。 如有BUG或建议,请稍后回复。

  您可以随意转载《DEDE使用优才优采云采集器实现文章自动发布和HTML实时更新功能》,但请保留本文出处和版权信息。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线