技术文章:关于织梦CMS用优采云自动发布文章并更新HTMl

优采云 发布时间: 2022-10-15 04:14

  技术文章:关于织梦CMS用优采云自动发布文章并更新HTMl

  DEDE利用优采云采集器的功能自动发布文章并实时更新HTMl。

  一、为什么会有这个想法:

  使用 优采云publishing文章 有三个主要缺点。

  需要登录才能发布,受DEDE系统限制太大

  即一次发布的数量是有限的,这可能会导致一次发布过多的负面后果。

  如果网站首页为静态文件,则首页无法更新,用户不知道网站的更新状态

  如果没有一直运行的服务器,使用 优采云采集器 的自动更新功能是不切实际的

  优采云采集器的自动更新功能是收费的,呵呵。

  我需要它,我想挑战自己。

  二、做。

  首先,我想到了让优采云发布大量数据,并将文章属性设置为未审核状态。这个问题很简单,但是我在使用DEDEv5.3.1的时候遇到了DEDE的一个bug。也就是说,未审核的 文章 实际上会显示在前台。先是骂了DEDE,后来找了一些原因,发现了DEDEv5.3.1的一个bug。修复后,未审核的文章无法在前台显示。1月13日向DEDE上报bug后,在1月14日DEDE发布的补丁中修复了这个问题,呵呵,所以,1月15日,今天,我们开始正式整理这份开发文档。

  实际发现发布和保存大量未审核的文章不是问题,而是如何实现随机激发发布功能。想了半天,觉得时限是最好的。当前端JS调用审计文章的链接,传递一个用户的信息,程序获取用户的IP并保存为SESSION信息,此时,审计一个文章并生成文章 与首页静态文件。一个用户在一定时间内只能激活有限数量的文章,而且发布的时候用的是用户的IP信息,哦,挺有个性的。

  激活文章,生成文章静态页面和首页静态文章,受网站模板的影响,可能会比较慢,首页在页面还没被关闭产生了问题。因此,最好的办法是在发布 文章 时生成 文章 静态文件,然后将 文章 设置为未审核。当 文章 被激活时,只需要一个简短的查询。在首页或列表页上尽量使用动态页面。这两个问题都不好处理,只能用这个方法代替。

  

  完整的流程是,在发布文档时,将文档设置为未审阅状态;调用程序时,首先判断最后一次查询的缓存是否超时,如果超过缓存时间,则清空缓存显示最新的 文章 。清除缓存后,查询一定数量的属性未审计的文档,取消Archives和Arctiny表中的未审计属性,更新文档的Pubdate字段,实现一点随机化。最后写入缓存,禁止在缓存有效期内重复更新!

  3.文件使用方法:

  发布文档时,请将文档属性设置为未审阅状态,即发布时提交的文档属性参数为:arcrank=-1,为动态浏览;

  如果要生成静态文档,请将文档状态设置为正常浏览状态,即arcrank=0;然后修改默认的文档加法器。

  例如:arcticle_add.php,在文件“//Generate HTML”底部添加一段代码:

  //生成HTML

  InsertTags($tags,$arcID);

  $artUrl = MakeArt($arcID,true,true);

  如果($artUrl=='')

  {

  $artUrl = $cfg_phpurl."/view.php?aid=$arcID";

  }

  $dsql->ExecuteNoneQuery("UPDATE `cmsxx_archives` SET `arcrank`='-1' WHERE (`id`='$arcID');");

  $dsql->ExecuteNoneQuery("UPDATE `cmsxx_arctiny` SET `arcrank`='-1' WHERE (`id`='$arcID');");

  

  然后,将New.php上传到你的网站根目录,进入Dede后台设置系统的基本设置,在性能选项卡中将arclist标签的调用缓存时间设置为合适的数字,比如3600 ,这意味着在一小时缓存中刷新一次。

  最后,只需调用模板文件顶部的一段代码:

  “”。

  支持的参数:

  no = 每次随机更新的次数,为空时默认为5;

  typeid=column ID,如果为空则为全站数据

  order=sort 方法,支持 Desc:逆序,Asc:顺序,Rand:随机,默认为随机查询。

  喜欢:

  " "

  排序为Desc时,按照先发布的文章的方法发布,Asc则相反,Rand随机。

  第四,这是我们在数据处理上的一次尝试,或许这个新模式会是一个突破口。祝大家使用愉快。如有BUG或建议,请稍后回复。

  点击此处下载文件:

  dedecms_v.rar

  操作方法:优采云采集器使用教程

  点击【热门采集模板】中的模板,或【更多>>】进入采集模板展示页面。您可以通过【模板类型】、【搜索模板】等多种方式搜索目标模板。

  ③ 无需模板

  如果没有找到您想要的模板,请进入模板展示页面,点击右上角【我要新模板】,提交新模板制作请求。

  官方将评估需求并安排新模板的制作。

  2.如何使用[采集模板]

  Step1:进入【模板详情页面】后,仔细阅读【模板介绍】、【采集字段预览】、【采集参数预览】、【样本数据】,确认采集到的数据经此模板符合要求。

  注意:模板中的字段是固定的,不能自行添加字段。如需在模板中添加字段,请联系官方客服。

  Step2:确认模板符合要求后,自行点击【立即使用】和【配置参数】。常用参数有关键词、页数、城市、URL等。

  请仔细查看【模板介绍】中的使用说明和参数说明,并以正确的格式输入参数,否则会影响模板的使用。

  Step3:然后点击【保存并开始】,选择【本地采集】开始。优采云自动启动 1 采集 任务和 采集 数据。

  

  Step4:数据采集完成后,可以按照需要的格式导出。以下是导出到 [Excel] 的示例。

  数据示例:

  通过 [采集 模板] 创建和保存的任务将放置在 [我的任务] 中。在【我的任务】界面,可以对任务进行各种操作,查看任务采集收到的历史数据。

  如何自定义采集?

  使用【智能识别】

  【智能识别】,只需输入网址,自动智能识别网页数据。支持列表类网页数据的自动识别、滚动和翻页。

  在首页输入框中输入目标网址,点击【开始采集】。优采云自动打开网页并启动智能识别。

  稍等片刻,等待智能识别完成。

  如果智能识别成功,一个网页可能有多组数据。优采云 会识别所有数据,然后智能推荐最常用的集合。如果推荐的不是你想要的,你可以自己【切换识别结果】。同时可以自动识别网页的滚动和翻页。本示例网址不需要滚动,只是翻页,所以只识别和检查【翻页和采集多页数据】。

  自动识别完成后,点击【生成采集设置】,自动生成对应的采集进程,方便用户编辑修改。

  然后,点击左上角的【采集】,选择【本地启动采集】,优采云会启动全自动采集数据。

  

  采集完成后,以您想要的方式导出数据。

  通过【智能识别】创建并保存的任务会放在【我的任务】中。在【我的任务】界面,可以对任务进行各种操作,查看任务采集收到的历史数据。

  值得注意的是,目前自动识别只支持列表类网页的识别,滚动翻页

  支持

  生活不易,文中的小卡片希望大家可以[点击],您的顺利点击将是我坚持的动力,点击即可,非常感谢!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线