规则采集文章软件(【新手建站系列】如何快捷的给linux服务器配置?)
优采云 发布时间: 2022-01-20 18:06规则采集文章软件(【新手建站系列】如何快捷的给linux服务器配置?)
前言
访问mjj论坛发现的小说站源码可以自动采集,感觉还不错,写个文字吧。
PC端是这样的:
移动端是这样的:
源代码下载:
链接:密码:tqvk(感谢原分享者:hostloc论坛@yingbi987)
准备服务器并创建一个虚拟主机:
和之前的教程一样,还是先部署lnmp环境,不再赘述。我的博客有详细教程,或者去官网看看(如果已经部署环境,请跳过这里)
【新手建站系列】如何快速配置linux服务器的lnmp环境
先把你准备的域名解析成服务器ip,然后创建虚拟主机。我认为下面的例子
需要注意的是,伪静态规则是thinkphp的规则,不设置伪静态是无法安装的。因为lnmp一键环境已经自带了这个规则,可以按照上图设置。如果用其他方式部署nginx环境,需要自己添加如下伪静态规则:
location / {
if (!-e $request_filename){
rewrite ^(.*)$ /index.php?s=$1 last; break;
}
}
将上面下载的源码上传到home/wwwroot/你的网站目录
使用xshellcd到网站的根目录,解压源码:
cd /home/wwwroot/book.fxmiao.net(换成你自己的目录)
unzip YGBOOK6.14.zip
将 网站 的所有者更改为 www 用户组:
chown -R www:www *
浏览器访问域名,开始安装
填写数据库等信息,这里注意不要修改管理员用户名,否则无法登录,安装成功后后台修改即可
安装成功后会自动跳转到网站的后台
之后,设置就等你自己去探索了。
设置采集
这个程序不能自己上传文章,只能上传采集。
这里有两条 采集 规则,均来自 hostloc 论坛,链接:密码:nry1
以规则 [ ] 为例,
点击导入:
粘贴 采集 规则并将其设置为如下所示:
采集测试一下(如果你想批处理采集请使用下面的批处理采集按钮)
可以看到 采集 成功了
然后你可以使用批量采集函数去采集(这个采集源大约有18000本书,并且在不断更新中)。
注意,采集 的书籍不会立即进入数据库,只有当用户访问它们时。
潜在问题
首先,请自行解读采集规则。其实很简单,也可以自己写。
如果你使用上面的采集规则,你可能会发现打开分类网站会卡住。这是规则的问题。然后你导入另一个 采集 规则,然后 采集 应该可以解决这个问题。
另外,您可能会发现网站首页和分类不显示内容,网页没有“打开”。首先可能是你的采集太少了,先采集1w或者更多的数据,然后等两到三天,这期间可以多访问几本书,然后然后可以在后台【数据块】刷新块数据。如果还是不正常,也可能是采集规则有问题。,请自己写。
喵大叔刚装上,玩了几天。因为不喜欢看小说,所以删除了网站。这不好玩!!!!