解决方案:phpcms v9自带采集模块功能体验
优采云 发布时间: 2022-11-20 07:09解决方案:phpcms v9自带采集模块功能体验
Phpcms网站管理系统最新版本为Phpcms v9。作为国内主流的CMS系统之一,已经应用于数以万计的网站。那么它内置的采集模块有什么作用呢,一起来看看吧。
文章合集
默认情况下,Phpcms v9 内置了三种内容模型:文章、图片和下载。我们先来看最常见的文章合集。以搜集新浪网频道和国内滚动新闻栏目为例
1.进入后台,内容-内容发布管理-采集
管理-添加采集
点。(与之前版本的Phpcms不同,采集
管理在模块菜单中)
2.网站规则。采集
项目名称随意填写,采集
页编码默认GBK。具体采集
页面的时候可以查看网页的源代码。
URL采集没有大的特征,通过查看采集页面的URL规则填写。分析目标页面后发现是一个URL序列,要获取的内容的URL都在这两个标签之间。没有其他干扰链接,因此无需定义必须和不能收录
在 URL 中的字符。如果目标网站配置了 Base,也应该配置它。
URL集合配置完成,但是如果目标网站列表页使用js实现上下页,或者获取的URL深度超过2级,用这个内置集合就很难实现了。
3.内容规则。phpcms使用“[content]”作为通配符,然后设置起止字符,然后过滤不需要的代码,实现内容采集
。分析目标页面的title标签比较规整,直接如图设置即可。
过滤格式为“待过滤内容[|]替换值”,删除则替换值留空。过滤规则支持正则表达式。系统自带几种常用的标签过滤规则。新手想要更灵活的过滤有点困难,所以新手需要先熟悉正则表达式。
根据规则获取作者规则、来源规则、时间规则。小编尝试了一个固定值,发现无法实现。就是将某个标签设置为固定值,比如设置“source”为 ,但是采集结果的source标签为空。
内容规则,填写开始和结束标签,我们测试的目标页面比较干净,所以只过滤掉里面的超链接和一些无用的标签。
内容分页规则,如果内容页有分页,则必须填写。这里的文章没有分页,小编会在后面的图集中介绍这个标签。
4.自定义规则。除了系统默认的标签外,您还可以自定义各种标签。规则都是一样的,但是有一点要注意:规则的英文名称一定要填写,否则自定义标签无法保存。
" />
5.高级配置,这次可以设置下载图片、图片水印、内容分页和导入顺序。注意,如果您需要水印,记得修改您网站上的水印图片。水印存放路径:statics/images/water
6、规则设置好后提交,返回藏品管理主页。您可以先通过测试,看看标签是否准确。
7. 发布内容。如果都准确的话,先点击采集网址,会自动采集文章的网址,过滤掉重复的网址。之后会弹出网址采集
完成的提示,点击“采集
文章内容”
采集自动进行并显示采集进度。
采集
完成后会自动返回采集
管理首页,点击内容发布,进入采集
文章列表,勾选要发布的文章,或者直接点击底部的全部导入。
进入发布计划选择界面,新建发布计划,选择发布栏目。本次测试选择文章模块的“国内”栏目。在计划创建页面,您可以设置自动提取摘要、自动提取缩略图、导入文章状态、标签和数据库对应关系。其中,*敏*感*词*文章的状态仅为“已发表”。如果站长需要状态为待审核,首先要修改相应栏目的工作流程为一级审核。
在标签与数据库的对应关系中,集合标签与数据库字段是一一对应的。如果有自定义标签,找不到对应的字段,需要修改模型添加字段,再修改模板显示。技术要求比较高,不适合新手。此外,系统自带了多项处理功能,也非常实用。
发布计划设置完成后,会自动导入刚才选择的文章,下次导入不需要再建计划,直接选择已经建好的计划即可。
文章征集和发布完成。看看效果:
后台内容管理页面
内容页
我们来看看图片集
" />
图片集
phpcms v9自带图片模型,也有图片处理的组图模式,方便一些站长搭建图片网站或者设置图片展示方式。下面来体验一下使用内置的采集
程序进行图片采集
,以采集
页面的图片为例:
网站获取规则和内容获取规则同文章合集。最重要的一点是phpcms v9的图片采集不应该只采集图片地址,应该采集整个
标签,以便可以将其作为组图进行处理。如本例所示:内容标签设置为
采集到的内容应该是这样的
还有一个分页问题。目标站寻呼如图:
网页代码为:
因此,您只需要在内容分页规则中选择list all模式,然后填写分页标签的起止符,系统就会自动采集分页内容。
设置规则后,采集
网址,采集
内容,发布内容。应注意发布计划。经过多次尝试,小编发现要实现群图模式,内容字段和群图字段都必须使用“处理成群图”功能。但是这种方式无法获取到第一个内容图片作为缩略图,所以最好自定义一个缩略图标签,直接获取一个内容图片地址作为缩略图。
设置后发布。查看采集效果:
栏目页
内容页
总结:经过仔细体验,phpcms v9的采集
功能还是比较全面的,可以满足基本的文章图片采集
。但是不够灵活,对于一些高要求的站长来说显然是不够的,门槛也比较高。采集模块的官方说明和帮助文件非常有限,不利于初学者。
核心方法:独立站SEO TDKU&ALT优化,不会代码也能学会!
眼看路,心中必有大局。
大家好,我是跨界少年锐雯。
这篇文章一共3600多字,估计要唱一首歌才能看完!
1、为什么要关注独立站SEO?
所谓SEO就是搜索引擎优化(Search Engine Optimization),对关键词进行优化,提高网站在谷歌等搜索引擎中的自然排名,以达到更好的曝光率和点击率。SEO对提升独立站或品牌的知名度有很大帮助,是一种低成本、优化、有效、稳定的推广手段。
SEO是一个复杂而持久的过程,包括Basic SEO、Content SEO、Off-Page SEO、Technical SEO等,涉及对公司业务和海外用户的理解、数据分析、SEO策略和技术等。
与SEM搜索引擎营销(Search Engine Marketing)相比,SEO通过用户的主动搜索为独立站点带来流量,因此更加精准,匹配搜索意图,而且“免费”。
可想而知,SEO优化对独立电商网站的获客成本和转化率影响很大!
但是SEO也有一些缺点,比如KD高,周期比较长,没有立竿见影的效果。
如果卖家的预算允许,还可以通过SEM和SEO相结合的方式进行推广,效果会更好。毕竟SEO和SEM各有优缺点,可以实现很好的互补营销推广。
2、如何有效优化独立站SEO?
那么如何进行独立站SEO优化呢?今天Riven给大家分享SEO中最重要的TDKU优化,它是Meta Title、Meta Description、Meta Keywords和URL Handle/Slug的首字母缩写。
2.1 元标题
元标题不仅是 SEO 的重要组成部分,也是您网站 URL 的门面。具有专业外观和描述性的元标题标签是在搜索引擎中获得良好排名的重要的第一步。
1)元标题标签值&显示位置
● 搜索引擎结果页面 (SERP)
GoogleBot 将抓取并分析元标题标签中的关键词 内容,并将其收录
并显示在Google 自然搜索结果页面上。可以说元标题内容是搜索者对你网站的“第一印象”。
● Web 浏览器窗口名称
元标题显示在网络浏览器的窗口名称中,特别是对于打开了很多浏览器选项卡的人。独特且易于识别的元标题以及网站图标有助于确保用户不会忘记网站的内容。
● 社交媒体头条
一些社交网络,如Facebook、Twitter、Line等,会根据你的og标题标签(og:title)决定当你分享URL页面时,会显示相应的标题内容(遵守open graph protocol ). 为了方便商家编辑,建站SaaS一般默认meta title = og:title和meta description = og:description。
2) 如何写好元标题标签?
2.2 元描述
为了让消费者直接了解页面内容,引起兴趣和购买意愿,“元描述标签”通常使用简短且相关的抽象文本来提高信息传递的准确性。
" />
1)元描述标签值&显示位置
● 搜索引擎结果页面 (SERP)
见元标题,这里没有更多细节
● 社交媒体头条
见元标题,这里没有更多细节
2) 如何写元描述标签?
2.3 Yuan关键词 (Meta Keyword) 1) Yuan关键词 价值
简单说明一下:meta关键字与常规关键字不同,它只出现在源代码中,不会在页面本身实时可见,最大的作用是告诉搜索引擎“这个网页的主题是什么” .
尽管谷歌内部人员在推特上表示,元 关键词 不再是谷歌排名算法的重要组成部分。
但是元关键字在传达您网站的信息和吸引搜索者访问您的网站方面仍然可以发挥很小但有益的作用。
而作为跨境品牌网站,像Shein这样SEO不错的网站都保留并设置了元关键词。
2) 如何编写好的元 关键词?
2.4 URL Handle/Slug1) URL Handle/Slug 值&显示位置
Google会识别并提取URL中的焦点关键词,并进行关键词反转,包括URL Handle中的关键词
这是产品句柄
2) URL Handle/Slug 怎么写?
2.5 图片ALT1)图片ALT值
图片搜索引擎优化是指优化您网站内的图片,以从谷歌等搜索引擎获得更多自然流量。例如,图片的 SEO 优化可以帮助您的网站在 Google 图片搜索中获得更好的排名。Below (DJI) 在 Google Image 上的“Camera drones”排名第 7 和第 9。
图片SEO优化的16条可行技巧,请阅读往期内容:
2)如何写出好的图片ALT?
3. SHOPLINE店铺如何设置?
在竞争激烈的跨境电商海外搜索引擎营销中,即使是最基础的SEO优化也可能有所帮助。为此,SHOPLINE开发了TDKU组件功能,用于快速SEO优化。卖家可以在不知道代码的情况下快速完成店铺的SEO设置。
-- 页面类型:主页、产品采集
、产品、博客帖子页面、博客采集
页面、自定义页面
3.1 优化各页面的TDKU
SHOPLINE店铺后台 > 网上商城 > 偏好设置 > SEO设置
SHOPLINE店铺后台 > 分类 > 打开创建的分类 > 编辑搜索引擎优化
SHOPLINE店铺后台 > 商品 > 打开创建的商品 > 编辑搜索引擎优化
" />
SHOPLINE店铺后台 > 商品 > 打开创建的商品 > 编辑搜索引擎优化
SHOPLINE 店铺后台 > 网上商城 > 博客 > 管理博客集 > 打开创建的博客集 > 编辑搜索引擎优化
SHOPLINE 店铺后台 > 网上商城 > 自定义页面 > 打开创建的页面 > 编辑搜索引擎优化
3.2 优化图片ALT
1)进入各个资源对象的编辑页面,点击对应的图片进行图片ALT编辑
2)在富文本编辑器中插入图片时,编辑图片ALT
3) SHOPLINE后台>设置>文件库>点击图片>编辑图片ALT
4)在SHOPLINE后台>网店>店铺设计>设计>编辑,编辑插入的图片图片ALT
4、如何在GSC中提交XML站点地图?4.1 什么是 XML 站点地图?
简而言之:XML 站点地图是您网站的 URL 列表。
Sitemap站点地图的作用:作为网站的URL路线图,可以告诉搜索引擎蜘蛛你的网站有哪些内容以及如何到达那里,辅助谷歌爬虫更快地建立索引。
SHOPLINE会自动为商户网站建立Sitemap.xml索引文件,并自动更新网址信息,帮您节省时间,简单方便地完成提交和收款工作。
4.2 提交Sitemap.xml给GSC
首先,卖家需要按照步骤在 Google Search Console 中验证域名所有权。
完成后回到SHOPLINE商城后台的应用市场,找到“SEO搜索引擎优化2.0”插件,即可找到对应网站站点地图的链接。或者在你的域名后面直接拼写/sitemap.xml
(例如域名
那么站点地图索引文件的地址是:
)
然后,在Google Search Console的Dashboard → Index → Sitemaps中,粘贴刚才复制的sitemap链接。最后点击提交,大功告成!
做SEO需要做一个长期主义者。请卖家做好SEO规划,耐心等待,不断优化SEO。
与SEM相比,SEO的效果不是立竿见影的,但对于大多数商家来说,SEO优化是独立跨境电商网站推广中为了获得更好的效果和更持久的流量的重点工作。