火车头采集小说教程规则须要注意的内容,可采集,一次搞了几百部!
优采云 发布时间: 2020-04-27 11:01最近在采集小说,小说站相对来说比较好采,也有几个须要注意的地方:
1、充会员,拿cookie
要充到会员拿cookie才可以采集火车头采集教程,要不然没有浏览权限。
2、小说站类型
有的小说站是微信公众号 微站的方式,需要手机抓包,相对网页站来说,麻烦一些,网页站点采集相对容易些,但是也有限制火车头采集教程,比如,找不到内容放哪儿去了,站长做防采集隐藏了上去。
3、外链 很烦
有的小说站在文章中嵌入了好多外链,格式式样不同,量十分大,让人太难受。
4、站点序号
这一点不同需求的人不同,采集小说上传到自己的小说站,需要采集到的文章小说有一定的规则,也就是根据序号排列,很多站点把序号故意整乱,格式乱七八糟,在匹配那些序号时,浪费了大量的时间。还不能做到,百分百匹配正确,2000千章的小说,总有这么一些匹配不正确的。
作者QQ129-0654-348
------------------------20181208更新------------------------
注意:
5、火车头采集小说时,请先说明采集模板式样,有童鞋,直接过来采集规则,然后前面须要依照模板再进行更改,会麻烦些,单本采集和全本采集的规则是不同的哦~
6、全本采集,有的小说站点在章节中没有小说名,如果须要从一级网址或则二级网址采集数据,需要火车头的会员版才行,免费版不能使用。
7、采集时假如cookie 失效,还须要我们学会抓包。
=====20191109更新=====
8、关于教程问题:
8.1、采集PC端的小说,根据《火车头基础教程》就可以解决,尤其是这些免费采集的PC端小说站点,比如:笔-趣、阁 ==八+一+中+文))网。
8.2、采集微信公众号小说教程比较麻烦,因为公众号的不稳定性,公众号会失效,可能须要重新制做教程,我那边也联系了一些做小说站的同学,很少乐意公开分享,所以,可能还须要再等待一段时间。
=====20191123更新=====
9、关于get和post的列表页
昨天有个同学须要采集的站点,是微信公众号的小说站,该站点会提早get出前15章,后面的全部是post恳求,该同学测试的时侯,老是发觉缺乏了前15章,后面我仔细查看以后发觉列表页get的数据没有获取到。
因为标签规则都是一样的,所以,直接把前15章的那种列表页网址复制到火车头的初始地址上面,就可以获取到了。
=====20200420更新=====
10、火车头小说采集视频教程