火车头采集小说教程规则须要注意的内容,可采集,一次搞了几百部!

优采云 发布时间: 2020-04-27 11:01

  最近在采集小说,小说站相对来说比较好采,也有几个须要注意的地方:

  1、充会员,拿cookie

  要充到会员拿cookie才可以采集火车头采集教程,要不然没有浏览权限。

  

  2、小说站类型

  有的小说站是微信公众号 微站的方式,需要手机抓包,相对网页站来说,麻烦一些,网页站点采集相对容易些,但是也有限制火车头采集教程,比如,找不到内容放哪儿去了,站长做防采集隐藏了上去。

  3、外链 很烦

  有的小说站在文章中嵌入了好多外链,格式式样不同,量十分大,让人太难受。

  4、站点序号

  这一点不同需求的人不同,采集小说上传到自己的小说站,需要采集到的文章小说有一定的规则,也就是根据序号排列,很多站点把序号故意整乱,格式乱七八糟,在匹配那些序号时,浪费了大量的时间。还不能做到,百分百匹配正确,2000千章的小说,总有这么一些匹配不正确的。

  作者QQ129-0654-348

  ------------------------20181208更新------------------------

  注意:

  5、火车头采集小说时,请先说明采集模板式样,有童鞋,直接过来采集规则,然后前面须要依照模板再进行更改,会麻烦些,单本采集和全本采集的规则是不同的哦~

  6、全本采集,有的小说站点在章节中没有小说名,如果须要从一级网址或则二级网址采集数据,需要火车头的会员版才行,免费版不能使用。

  7、采集时假如cookie 失效,还须要我们学会抓包。

  =====20191109更新=====

  8、关于教程问题:

  8.1、采集PC端的小说,根据《火车头基础教程》就可以解决,尤其是这些免费采集的PC端小说站点,比如:笔-趣、阁 ==八+一+中+文))网。

  8.2、采集微信公众号小说教程比较麻烦,因为公众号的不稳定性,公众号会失效,可能须要重新制做教程,我那边也联系了一些做小说站的同学,很少乐意公开分享,所以,可能还须要再等待一段时间。

  =====20191123更新=====

  9、关于get和post的列表页

  昨天有个同学须要采集的站点,是微信公众号的小说站,该站点会提早get出前15章,后面的全部是post恳求,该同学测试的时侯,老是发觉缺乏了前15章,后面我仔细查看以后发觉列表页get的数据没有获取到。

  因为标签规则都是一样的,所以,直接把前15章的那种列表页网址复制到火车头的初始地址上面,就可以获取到了。

  =====20200420更新=====

  10、火车头小说采集视频教程

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线