干货教程:PHP简单采集器制作
优采云 发布时间: 2022-10-24 00:16干货教程:PHP简单采集器制作
PHP 简单 采集器 制作
PHP 简单 采集器 制作
采集器,通常称为小偷程序,主要用于抓取别人网页的内容。关于采集器的制作,其实并不难。就是远程打开网页为采集,然后用正则表达式匹配需要的内容。只要你有一点基本的正则表达式,你就可以做到。拿出你自己的 采集器。
前几天,做了一个小说连载程序。因为怕更新麻烦,写了一个采集器,采集巴鲁中文网站。功能比较简单,不能自定义规则,不过大体思路在里面,自定义规则可以自己扩展。
用php做采集器主要用到两个函数:file_get_contents()和preg_match_all()。前者是远程读取网页内容,但只能在php5以上版本使用。后者是常规功能。用于提取所需的内容。
下面逐步介绍功能实现。
因为是采集小说,首先要提取书名、作者、流派,其他信息可以根据需要提取。
这里是《回归明朝当太子》的目标,首先打开参考书目页面,链接:
再打开几本书,你会发现书名的基本格式是:ISBN/Index.aspx,所以我们可以做一个起始页,定义一个,用它输入需要为采集的ISBN,然后我们可以通过 $_POST ['number'] 这种格式来接收需要采集的书号。收到书号后,接下来就是构建书目页面:$url=$_POST['number']/Index.aspx,当然这里是个例子,主要是为了解释方便,就是最好检查 $ _POST['number'] 的有效性。
干货教程:phpCMS V9 - 使用教程
步骤 2:添加站点时指定发布点
第三步:添加站点时设置的域名指向发布点的所有服务器或目录(请在域名解析管理中心解析)
基本设置
依次位置:【设置】→【基本设置】
这个基本配置用来设置网站相关文件的存放目录。比如 CSS/JS 图片等。
词汇表
附件URL访问路径
即用户上传的文件存放的位置
CDN加速使用
可以使用CDN网络文件(比如JQuery,不能在本地存储JQuery文件)
安全配置
导航至:[设置] → [安全配置]
此配置可以设置后台登录失败的最大次数,以防止密码被尝试。
PHPSSO 配置
PHPSSO 是用 PHP 开发的单点登录系统。在连接PHPSSO的多个应用系统中,用户只需登录一次,即可访问所有相互信任的应用系统。
如果系统开启了单点登录,在应用ID中填写对应的ID和加密密钥。
这个数据和 SSO 中的应用管理配置必须一致!
角色管理
角色定位所有具有该角色的管理员权限,管理员可以为不同的角色成员分配不同的权限配置。说白了,当一个网站被多人操作的时候,需要这个配置给别人分配权限,谁可以做什么谁不能。
依次导航:【管理员设置】→【管理员管理】
如下图所示,目前只有一名超级管理员(最大):
它记录了任何人的登录时间和各种有意义的信息,供管理员参考。
1、比如我们添加一个管理员:
然后设置管理员信息,其他信息很容易获取,主要是角色位置,意思是管理员可以对网站做什么:
模块管理
如果对计算机编程中模块的含义不熟悉,请移步:%E6%A8%A1%E5%9D%97%E5%8C%96%E7%A8%8B%E5%BA%8F%E8 %AE% BE%E8%AE%A1/1154869
如果您理解,请继续阅读。
在phpcms管理系统中,“模块管理”用于设置和配置用户管理系统的内置或用户自定义开发模块。让我们在这里谈谈系统。
可以看到,phpcms为我们准备了很多常用的模块,我们可以直接添加使用。
假设项目需要使用在线充值功能,如果没有phpcms,只能自己写一个在线充值功能。但是现在有了phpcms的模块管理,可以直接添加在线充值功能(然后简单配置)。
添加公告模块
为了方便起见,我们尝试在首页添加公告模块,我们来看看首页现在的样子:
然后,点击打开:【模块】→【模块列表】→【公告】
点击添加公告,如下图:
弹出如下页面,设置公告内容,最后点击【确定】:
确认后,将显示您的默认主页!
添加其他模块也是一样,只是设置的东西不一样。
添加现有页面
有时候,我们想自己写一个页面,放到phpcms中进行操作,那该怎么做呢?
1.我新建一个文件夹,里面有一个页面,然后简单的写一些代码:
2、找到PHP目录下的phpcms文件夹,粘贴刚才的demo文件夹:
注意:要根据自己的目录进行操作,以下是我的目录,供大家参考。
放入后,我们回到管理员后台中心进行设置:
然后进行站点配置,如下图所示:
完成后,它将出现在列表中:
接下来,让我们通过站点域名访问我们自己的网站:
http://localhost/phpcms/demo/
伟大的!有效!里面是我们写的代码!
标签使用
在phpcms V9中,我们需要PC标签作为获取数据的一种方式,这是phpcms指定的语法,就像CSS为什么那样写,我们必须遵守。
PC标签分类:
工具类:一般可以理解为phpcms V9.0提供的一些工具箱。模块类:phpcms V9的每个模型都提供了调用模块数据的数据接口。
// PC标签是以下面的方式进行声明
{pc:content action="lists" cache="3600" num="20" page="$page"}{/pc}
PC 标签必须以 {pc} 开头并以 {/pc} 结尾。
当然不以{/pc}结尾不会导致程序出现致命错误,导致程序无法继续运行。
接下来,我们分析上面的例子。
在 PC 标记中,{pc:} 冒号后跟模块名称。比如上面的例子调用了内容模型的PC标签:
action="list"
这种形式代表参数。每个 phpcms V9 模型都定义了要为其 PC 标签调用的参数。其中一些调用参数由系统保留,对所有 PC 标签有效。
必须使用参数:
参数名="参数值"
多个参数用空格隔开(如下例),参数值可以用双引号括起来。无论是哪种形式的引号,它们都必须成对出现。
{pc:content 参数名="参数值" 参数名="参数值" 参数名="参数值"}
显示标签
默认情况下,PC 标签中的数据以数组形式返回。可以通过 $data 获取数组。如果您在 PC 标签中定义了返回参数,则返回的数组将使用返回值进行命令。
一般来说,您可以使用以下方法来显示该值:
{loop $data $key $val} {$val[title]} {/loop}
其中,$val[url]和$val[title]需要根据使用的PC标签和返回的数据来判断。
由于涉及的知识太多,使用技巧和渲染机制较多,请自行查阅资料,不再展开。
扩张
这个功能块主要集中了全站各个模块的一些扩展属性,可以更加直观快捷的进入需要的功能页面!
这里涉及的知识太多了。有兴趣可以自行百度。我不会在这里展开它。