自动采集系统(2.网站安装步骤及安装方法.1增加原创功能)
优采云 发布时间: 2022-04-14 14:00自动采集系统(2.网站安装步骤及安装方法.1增加原创功能)
安装步骤:
1.解压文件并上传到对应目录等
2.网站伪静态必须配置好(参考上一步的配置)才能正常安装使用(第一次访问首页会自动进入安装页面,或者手动输入域名.com/install)
3.同意使用协议进入下一步检查目录权限
4.测试通过后填写通用数据库配置项,填写正确即安装成功,安装成功后会自动进入后台页面域名.com/admin,填写安装时输入的后台管理员和密码登录
5.在后台文章列表页面,可以手动执行采集文章,批量采集文章数据。初次安装后,建议采集一些数据填写网站内容。网站在运行过程中,操作采集会自动执行(需要前台访问触发,蜘蛛也可以触发采集),无需人工干预
环境要求:PHP5.4 以上,具有伪静态功能。推荐配置,php7.1,mysql5.6+
托管要求:可以使用IIS/APACHE/NGINX,可以使用虚拟主机/VPS/服务器/云服务器。推荐linux系统,apache/nginx都可以
硬件要求:对CPU/内存/硬盘/带宽的大小没有要求,但是配置越高,采集效率就越好!
其他要求:比如采集目标服务器在中国,而你的主机在国外,会导致采集效率低下。采集应尽量选择同一区域的网站。美国服务器应该选择机房在美国的小说站,国内服务器应该选择国内网站,尽可能提高网站的速度。
更新提示:
1.添加关键词功能,可批量添加,tdk可定制
2.添加广告位管理功能
3.百度站点增加搜索功能,修复百度结构化数据覆盖错误的bug
4.增加图片延迟加载功能,可在PC端或全站开启或关闭
5.新增新颖的黑名单和IP黑名单功能
6.添加作者功能
7.增加通过ID指定节点的功能采集(范围或指定)
8.友情链接修改,允许同名关键词
9.修复章节内容编辑后乱码问题
10.新增原创功能
11.新增小说节点批量转换新节点功能,指定小说转换节点功能
12.添加百度主动推送功能
13.新增单曲格模板,适合单篇小说
14.重采样功能,如文中的关键词(手头可以指定关键词)之类的,下次再读会从源头重启网站采集
15.Re-采集章节的url与缓存中的url不一致时的内容,解决因节点变化或来源导致章节不对应章节变化的问题站点编辑器删除重复的章节
16.增加简繁切换功能,记录cookies,自动切换页面
17.修复栏目页自定义TDK无效问题,小说页新增单篇小说自定义TDK
18.更改加密方案。新版本使用新的授权文件,旧版本不受影响。后台授权检测间隔调整为24小时,减少授权服务器对用户网站后台的影响
19.添加节点库的定义,已经存储的小说遇到其他节点也会进入节点库,方便小说切换到其他节点。也就是说,如果你的节点库在新节点中没有小说的记录,则无法将小说切换到指定节点。
20.功能模块拆分,方便后续增强
21.修复站点地图不显示时间的bug,增加对google和https的兼容性
22.其他大量功能优化不再一一赘述