优采云采集器如何按顺序采集新颖的章节?实际经验!
优采云 发布时间: 2020-08-07 15:57优采云采集的小说可以根据小说的章节进行采集,也可以根据整本书进行采集. 实际上,主要问题是发布格式. 首先,必须先明确发布格式,然后才能指定规则. 否则,采集和发布是错误的. 头疼.
小说网站可以采集网页或官方帐户,这两者都可以采集,具体取决于目标位置!今天,我将分享如何根据新颖的章节进行采集:
1. 列表页面是初始URL,它是根据列表页面的更改规则设置的. 如果您不知道有多少章,则可以再设置几页然后进行测试.
2. 从列表页面获取章节URL,该URL可以通过列表页面的源代码采集;
3. 在章节内容页面上采集所需内容,例如标题内容;
4. 如果要在列表页面上获取缩略图概要文件或作者信息,则需要VIP才彩云版本,或使用破解版进行采集. 采集https的破解版本有问题,我已经遇到过很多次了. 我不知道这是我的本地计算机的原因,还是优采云本身的破解版问题.
5. 如果要按顺序采集并采集整本小说,则需要获取第一章的地址,然后获取页面中的页面URL,然后获取.
6. 重要提示: 发布格式,需要哪种格式,这非常重要,可以根据格式选择哪种采集方法.
7. 我很头疼: 如果按照各章发行,则订购标签上必须有阿拉伯数字. 这将非常麻烦并且错误率很高. 需要更好或更完整的章节编号替换文件. ,对于批量替换,许多章节的命名顺序不同,具有极高的自定义样式,凌乱
20191203更新:
对于某些程序需求,在成功导入之前,按照以下样式的顺序排列各章. 请使用这种方法来采集“优采云合集小说教程批处理多个合集教程”
1.txt
2.txt
3.txt
4.txt
......