Discuz X3.2 采集教程 – 火车头采集器 v7
优采云 发布时间: 2020-04-24 11:00
一般做站的人基本上都晓得采集,尤其是做站群或则做峰会的人。但是现今网上的采集工具基本上都是收费的。而且不光软件收费,采集规则还收费。真是羊绒一把把的薅啊。像火车头这个软件,现在早已到 v9 了,但是精典款还是 v7.6 ,至于为何,你们自己心中应当有数。一般采集内容你们就会,直接定义起始点和结束点就可以了。而火车头带的这个 Web发布配置管理就有点麻烦了。今天 Forece 教你们怎么用设置火车头采集器 v7.6 的Web发布配置管理。针对的是 Discuz X3.2 / X3.3 / X3.4
打开火车头采集器 v7.6 - 工具 - Web发布配置管理
弹出一个新窗口,我们一个一个配置,先来这个登入配置,点击手动抓取登录数据包
在以后弹出的窗口中输入 Discuz 论坛的地址(Forece 用的本地测试),然后登录你注册过的用户。在 Post 数据框那儿应当可以看见数据,然后点击确定。当然若果有的网站无法使用手动登入获取 POST 数据的话,你可以用 Fiddler 来获取 Post 数据。然后在上一个窗口中,选择粘贴 Post 数据。
Post 数据通常是长这个样的:
fastloginfield=username&username=forece&password=xxxxxxxxxxxxxx&quickforward=yes&handlekey=ls
点击确定后,你可以听到大部分表格都早已填写完毕了
我们还须要再做一下更改,需要将 username 和 password 的表单值改为 [用户名] 和 [密码],另外还须要加一个登录失败标志码码和登录成功标志码。
登陆失败标志码
登录失败
登陆成功标志码
<script type="text/javascript" reload="1">
最后截图如下:
然后我们步入下一个 Tab ,网页随机值获取。获取这个数值的诱因是因为 Discuz 有一个称作 formhash 的东西。这玩意还不是固定的火车头采集教程,每次都变。
然后依次填入以下数据:
获取页面:
/forum.php?mod=post&action=newthread&fid=2
来源页面
/forum.php?mod=post&action=newthread&fid=2
随机值前字符串
name="formhash" value="
随机值后字符串
然后将 每次恳求都使用第一次获取的网页随机值 的选项关闭。
PS: 获取页面和来源页面是你发布贴子的页面。大家听到我旁边的 fid=2 是我的版块名称,请依照自己 Discuz 论坛的情况配置。
最后设置截图如下:
内容发布参数的设置和登录的有点类似火车头采集教程,也是须要获取 Post 数据
登陆进峰会 - 选择发贴 - 填写标题 - 内容 - 按发贴 - 获取 Post 数据 - 按确定
Post 数据应当是这样的:
formhash=9c552f8e&posttime=1507576154&wysiwyg=1&subject=%E7%81%AB%E8%BD%A6%E5%A4%B4%E8%8E%B7%E5%8F%96+Post+%E6%95%B0%E6%8D%AE%E6%B5%8B%E8%AF%95%E5%B8%96&message=by+Forece&replycredit_extcredits=0&replycredit_times=1&replycredit_membertimes=1&replycredit_random=100&readperm=&price=&tags=&rushreplyfrom=&rushreplyto=&rewardfloor=&replylimit=&stopfloor=&creditlimit=&allownoticeauthor=1&usesig=1&save=
按完确定后,表单数据获取完毕,我们还是须要更改一些表单。
formhash: [网页随机值1]posttime: [系统时间戳]subject: [标签:标题]message: [标签:内容]
发表错误标志码
抱歉,您的恳求来路不正确或表单验证串不符,无法递交
抱歉,您仍未输入标题或内容
成功标志码
帖子地址复制成功
最后截图如下:
其实到现今这个Web发布规则早已配置完毕,但是由于 Discuz 用的是 UBB 标签而不是 HTML 标签,所以我们再稍为让这个发布规则更完美一些。进入中级功能,选择操作类型,标签填写 [标签:内容] ,CMS 选择 Discuz , 按确定。
然后回到内容发布规则里,将表单message里面的值替换成{0}
按照自己的情况来配置,是 UTF-8 就填写 UTF-8,是 GBK 就填写 GBK 别搞混了。
PS: 不知道为何保存完规则后网页随机值消失不见了,我测试的时侯仍然未能发布内容,重新把网页随机值加进去就好了。