多页采集是否可以实现unicode转码功能?

优采云 发布时间: 2020-08-12 04:16

  今天站长在峰会见到这样一个求援的贴子,想要实现优采云采集器多页采集器实现unicode转码,然后通过恳求转码后的地址采集到相关的内容。下面先介绍一下问题的需求详情,然后再说一下该功能的实现方式和操作步骤。希望可以帮助到那位求助者。

  id= "\u7f8e\u5973\u56fe";

  从前面的页面里,采集到url,再拼接成新的地址,做为多页的地址, 拼接下来的地址里能把unicode的编码,转成英文吗?

  通过这个地方提取到的多页地址为:\u7f8e\u5973\u56fe,直接访问这个地址,无法正常访问。转码之前的地址是:美女图。目前想要采集这个地址,求助实现的办法。

  

  想把里面划红线的地方,变成英文, 相当于做一次Form js string的编码转换, 要怎样实现呢? 谢谢

  目前最新版的采集器9.11之后的版本可以实现列表页地址特殊处理的功能,参看右图。但是多页地址这儿目前没有这个功能,因此就不能使用这个技巧了。如果会使用插件开发的人呢,可以自己开发一个插件实现这个功能。如果不会,可以换个角度去实现。如果所有的多页这儿的字符串都一样,可以直接在多页设置上面即将替换的内容写死,这样就可以实现了。如果这个方式不能满足你的需求,只能使用插件来开发了。如果多页这儿可以直接调用标签数组的话,会更方便也愈发开放。但是目前官方还没有实现这个功能。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线