javascript 分页 如何采集内容
优采云 发布时间: 2020-08-13 21:30用外部的php文件处理下,就是把采集的内容页作为外部的php文件的递交参数,用自定义的方法把组合成
:1108/eol_fenye.php?url=
复制代码
这样的地址,url参数就是踩到的内容页地址
外部php文件处理分页,根据原网站的分页规律生成优采云可采集的分页代码,输出原网站的源码+生成的分页代码,这样优采云就可以采集了
需要本地搭建php运行环境,有很多一键安装的集成包,我用的是discuz的ComsenzEXP,下载网站
安装后,要把php文件放在网站运行的目录里,ComsenzEXP默认C:\ComsenzEXP\wwwroot,把压缩包解压后上面的eol_fenye.php文件放在这儿即可
文件访问地址就是:1108/eol_fenye.php,要加url参数,:1108/eol_fenye.php?url=,可以看见分页疗效
外部插口我还不熟悉,获取源码的方法也可能会出现问题,路乱码等,需要学习改进,路有问题可以联系我
采集规则,分页区域设置见规则
php文件压缩包