干货教程:phpcms v9自带采集模块功能体验_phpcms_CMS教程_迪尔课堂

优采云 发布时间: 2022-10-10 23:07

  干货教程:phpcms v9自带采集模块功能体验_phpcms_CMS教程_迪尔课堂

  Phpcms网站管理系统最新版本为Phpcms v9。作为国内主流的cms系统之一,目前有数以万计的网站应用。. 那么它自己的采集模块的功能呢,我们来看看。ttr迪尔课堂自学网-|第二课堂|--(官网)

  文章采集ttr迪尔课堂自学网-|第二课堂|--(官网)

  phpcms v9默认内置文章、图片和下载三种内容模型。我们先来看看最常见的文章采集。以采集新浪互联网频道、国内滚动新闻栏目为例ttr迪尔课堂自学网-|第二课堂|--(官网)

  1.进入后台,内容-内容发布管理-采集管理-添加采集积分。(不同于以往版本的phpcms,采集是在模块菜单中管理的) ttr 迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  2.网址规则。采集项目名称随便填,采集页面代码默认为GBK。对于具体的采集页面,可以查看其网页源代码。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  URL采集没有大的特点,通过查看想要的采集页面的URL规则来填写。分析目标页面的结果是一个序列URL,而要获取的内容的URL都在两个标签之间。没有其他干扰链接,因此无需定义哪些字符必须收录在 URL 中,哪些字符不能收录在 URL 中。如果目标 网站 配置了 Base,那么也配置它。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  URL采集的配置完成了,但是如果目标网站列表页使用js实现上下页,或者要获取的URL深度超过2级,就会很难使用内置的采集。ttr迪尔课堂自学网-|第二课堂|--(官网)

  3.内容规则。phpcms就是用“[content]”作为通配符,然后设置开始和结束字符,然后过滤掉不必要的代码,实现内容采集。分析目标页面的title标签比较规整,可以直接如图设置。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  过滤格式为“要过滤的内容[|]替换值”,如果删除,替换值留空。过滤规则支持正则表达式。系统自带几个常用的标签过滤规则。新手要更灵活的过滤有点困难,所以新手需要先熟悉正则表达式。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  根据规则获取作者规则、来源规则、时间规则。小编尝试了一个固定值,发现无法实现,即给某个标签设置固定值,比如设置“source”为,但是采集结果源标签为空。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  内容规则,填写开始和结束标签,我们测试的目标页面比较干净,所以只过滤掉里面的超链接和一些无用的标签。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  内容分页规则,如果内容页有分页,一定要填写。这里没有分页文章。小编会在下图采集中介绍这个标签。ttr迪尔课堂自学网-|第二课堂|--(官网)

  4.自定义规则,除了系统默认的标签外,还可以自定义各种标签。规则是一样的,但是有一点需要注意:规则的英文名称一定要填写,否则自定义标签无法保存。ttr迪尔课堂自学网-|第二课堂|--(官网)

  5.高级配置,这次可以设置下载图片、图片水印、内容分页和导入顺序。请注意,如果您需要水印,请记住修改 网站 的水印图像。水印存储路径:statics/images/waterttr 迪尔课堂自学网-|第二课堂|--(官网)

  

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  6、规则设置好后,提交并返回采集管理首页。您可以先通过测试,看看每个标签是否准确。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  7. 发布内容。如果无误,先点击采集网址,会自动采集文章地址,过滤重复网址。然后会弹出采集网址补全的消息,点击“采集文章内容”ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  采集自动显示采集进度。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  采集完成后会自动返回采集管理首页,点击内容发布,进入采集文章列表,勾选文章即可发布,或者直接点击底部的全部导入。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  进入发布计划选择界面,新建发布计划,选择发布栏。此测试选择 文章 模块的“国内”列。在新的计划页面上,可以设置自动提取摘要、自动提取缩略图、导入文章文章状态、标签和数据库对应关系。其中,import 文章状态只有一个“release”。如果站长需要状态为待审核,则必须先将相应栏目的工作流程修改为一级审核。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  在标签与数据库的对应关系中,采集标签与数据库字段一一对应。如果有自定义标签,找不到对应的字段,需要先修改模型添加字段,再修改模板显示,技术要求高。,不适合初学者。此外,系统自带多项处理功能,也相当实用。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  发布方案设置好后会自动开始导入选中的文章,下次导入不需要创建方案,选择已有的方案即可。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  文章采集,发布完成。看看效果:ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  后台内容管理页面

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  内容页ttr 迪尔课堂自学网-|第二课堂|--(官网)

  下面我们来看看图片采集ttr迪尔课堂自学网-|第二课堂|--(官网)

  

  图片采集ttr迪尔课堂自学网-|第二课堂|--(官网)

  phpcms v9自带图片模型,还有图片处理的组图模式,方便一些站长制作图片网站或者设置图片显示方式。下面我们来体验一下内置采集程序对采集图片的使用,以采集页面上的图片为例:ttr迪尔课堂自学网-|第二课堂| - (官方网站)

  网站获取规则和内容获取规则同文章采集。最重要的一点是phpcms v9 采集的图片不能只是采集图片地址,而应该是采集整个

  标签,以便可以将其作为组图进行处理。如本例:内容标签设置为ttr Dier Classroom Self-Learning |Second Classroom|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  采集内容应该是这样的 ttr 迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  还有一个分页问题。目标站的寻呼如图:ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  网页代码为:ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  所以只需在内容分页规则中选择list all模式,然后填写分页标签的起止字符,系统会自动采集对内容进行分页。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  设置规则后,采集URL,采集内容,发布内容。发布方案时需要注意的是,经过多次尝试,小编发现要实现群像模式,内容字段和群像域都必须使用“进程作为群像”功能。但是这种方式无法获取第一张内容图片作为缩略图,所以最好自定义缩略图标签,直接获取内容图片地址作为缩略图。ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  设置时发布。查看采集的效果:ttr迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  专栏页ttr 迪尔课堂自学网-|第二课堂|--(官网)

  ttr迪尔课堂自学网-|第二课堂|--(官网)

  内容页ttr 迪尔课堂自学网-|第二课堂|--(官网)

  总结:经过仔细体验,phpcms v9自带的采集功能还是比较全面的,基本满足文章和图片采集。但是,它不够灵活。对于一些高要求的站长来说显然是不够的,门槛很高。采集 模块的官方描述和帮助文件非常有限,不利于初学者。ttr迪尔课堂自学网-|第二课堂|--(官网)

  扫描手机进入

  免费提供:免费WordPress自动采集插件工具【Wordpress网站必备】

  WordPress Auto采集 插件工具适用于任何 WordPress 版本并支持任何 WordPress 主题。不要浪费服务器资源,不要拖慢服务器!最近有朋友向我抱怨说 WordPress采集 插件太卡,导致服务器溢出。我给了他一个免费的采集发布工具,可以充分利用本地电脑的性能加速采集 Post。不再担心版本问题或编写 WordPress采集 规则。

  1. WordPress采集采集工具

  如果每个版本的WordPress需要安装不同的插件,就必须对应不同的版本,每个网站都要写采集规则。这将需要很多时间。所以选择好的WordPress采集器,支持大版本发布采集。操作一定要简单,只要操作简单,不会花太多时间。

  只需导入关键词到采集相关的关键词文章,同时创建几十个或几百个采集任务(一个任务可以支持上传1000个关键词关键词),支持大平台采集。(搜狗资讯-微信公众号-搜狗知乎-头条资讯-百度资讯-百度知道-新浪新闻-360资讯-凤凰新闻等,可同时设置多个采集来源采集)

  

  实现自动批量挂机采集,无缝对接各大WordPress版本发布者,实现采集发布自动挂机。

  如何批量管理和发布WordPress版本网站:

  2.有一个批量管理和发布WordPress版本的工具

  无论是Empire、Yiyou、ZBLOG、织梦、wordpress、PB、Apple、搜外等各大cms工具,都可以同时支持批量管理和发布工具,具有不同栏目不同设置关键词文章,定时发布+每日发布总量+数据监控=完美解决效率低的问题。

  同时附上监控数据:软件直接监控发布数量,待发布数量,伪原创是否成功,发布状态(是否发布成功),网站发布、发布程序、发布时间等

  

  如何实现快速批量收录排名:

  网站刚成立的时候,搜索引擎会对网站有一段时间的调查,而这段时间对于网站来说是最重要的时期。对于搜索引擎收录网站文章,我们必须积极引导搜索引擎蜘蛛抓取网站的内容。

  以上网站是小编使用WordPress采集发布者实现的效果,网站目前流量接近10000!看完这篇文章,如果你觉得不错,不妨采集起来,或者发给需要的朋友和同事!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线