文章采集接口( jiekou.php,修改:就是上图是用于测试的规则)
优采云 发布时间: 2022-03-25 01:01文章采集接口(
jiekou.php,修改:就是上图是用于测试的规则)
解压后看到的文件有:
其中,discussX3.0.wpm为发布模块,dz test interface.ljobx为用于测试的规则。以后不要问规则怎么写,就这样写吧。
1.上传界面
根据你的网站代码选择GBk或者utf8文件下的接口文件jiekou.php,这个接口有密码,默认是123456,如果要修改,打开这个jiekou.php,修改:
这是上图。将默认的“123456”更改为您想要的。修改后,必须保存。如果你不理解它,请不要修改它。
然后把这个文件上传到DZ的根目录网站,不知道我百度的根目录是什么,别问上传到哪里,我自己的网站
其他人怎么知道你的根目录是什么?
然后我们尝试在浏览器中访问它。访问地址为网站域名/jiekou.php?pw=password。这个密码就是上面提到的接口密码:
如果能出现论坛模块,就证明界面是对的。
2.导入发布模块
点击发布按钮:
打开配置界面(有些慢,稍等):
导入成功会有提示。
发布模块设置:
第一步是选择我们刚刚导入的dz发布模块。
第二步:全局变量就是上面提到的接口文件密码
第三步:选择对应的代码
第四步:网站根目录填入接口文件名和我们访问上面接口时的剩余地址。然后选择“无需登录和 Http 请求”
第五步:点击获取列表,如果论坛版块可以显示,则说明以上4步设置正确。
设置好点击测试配置后,成功后,设置一个配置名称保存此配置供在规则中使用,
简单分发,仅发布标题内容回复的情况
我们打开发布模块,介绍一下里面的内容:
单击编辑按钮转到“内容发布参数”选项卡:
引入表格名称:
username:对应论坛发帖和回复的用户名
subject : 对应论坛的标题
message : 对应发帖的主题和回复的内容,这两部分放在一起
fid : 对应于section ID
signature :发送者和响应者的签名内容,这里也放在一起
publishdat:发帖和回复的时间,相同的两部分放在一起
typeid :对应主题类别的ID
typename:对应于主题类别名称,上面我们写了类别ID,这里我们不需要设置值,将表单值留空即可。
sortid:对应分类信息的ID
fanme:对应section的名字,fid的值也是上面设置的。这里的值可以不设置,表格值可以留空。
头像:发帖人和回复人的头像信息,相同的两部分放在一起
tags:发帖时设置的标签
如果我们不需要表单值,比如我们不需要签名,我们按照上图选择这个,然后点击“修改表单值”,这里的表单值设置为空,如图以下:
然后用同样的方法处理其他我们不想要的形式如下图所示。我不需要 typeid、typenam 等形式。我只是使用上面的方法将它们的表单值设置为空:
当然,你需要什么样的形式取决于你。
我们将测试规则导入到采集器中来说明规则设置:
第二步:采集内容规则,我们直接点击右边的“测试”按钮就可以看到内容采集,这个规则就是采集dz官方论坛。
因为是采集论坛,内容标签采集是发帖内容和回复内容,作者标签采集是发帖用户名和回复用户名、头像和时间,和签名,都是发帖人和回复人信息的组合。
采集 给作者,接口是自动注册的。
要使用标签循环右侧的“标签循环处理”分隔符,必须写“||||”,右侧的信息看到结果与每个信息用“|||”连接.
说到头像标签,用户的头像必须像“头像图片地址用户名”一样组合在一起。
规则如何设置取决于自带的规则,可以删除不必要的标签。添加需要添加的标签。总之,规则中的标签与发布模块中的标签一一对应,标签名称应相同。
好吧,我没有看到发布模块中的内容标签。事实上,发布模块中的 {0} 已被替换。全部设置好后,在规则中使用如下图:
接口扩展说明:
设置界面注册的用户名和密码,打开界面:
这里设置的密码是新的用户注册密码,我设置为12346,那么所有界面注册用户的登录密码都是123456
如果留空,新注册的用户名和密码为:连接用户名和密码参数,在md5下取后面的12位,上图中的用户密码就是用户名和密码参数,可以设置。
如果回复用户名不是采集,则使用界面中设置的用户名,如下图:
这些可以修改。
界面中有如下映射关系:
这意味着我们创建了一个名为 fname 的标签。如果采集去“section 1”,那么就发布对应section id为1的section。这个可以根据自己的论坛section修改,下面的typname也一样,这样设置的好处是无需将类别id设置为直接与版块名称和主题类别名称自动对应。