成熟的解决方案:纸飞机DiscuZ专用采集器
优采云 发布时间: 2022-10-19 16:28成熟的解决方案:纸飞机DiscuZ专用采集器
纸飞机DiscuZ专用采集器为文章采集,分页采集,采集内容过滤超链接,帖子中图片自动下载,内容关键字过滤替换,在内容末尾添加的自定义内容等。
纸飞机DiscuZ采集器应用平台:纸飞机DiscuZ采集器应用平台可以在Windows 2000或以上系统上运行。需要安装.NET FrameWork3.5 框架。win7以上版本的系统无需下载安装。经测试,支持DiscuZ2.0、DiscuZ2.5。.
软件的所有采集规则都是根据网页源码的前后代码截取中间部分,所以很简单。
纸飞机DiscuZ专用采集器主要功能:
文章采集
分页采集
采集内容过滤超链接
自动下载帖子中的图片
内容关键字过滤器替换
在内容末尾添加自定义内容
采集规则导入、导出
支持带有相关链接的 采集网站
采集返回的是HTML格式的文章,所以发到论坛需要开启相关版块支持HTML代码。
自动登录需要关闭验证码登录,也可以手动登录浏览器快速登录,无需重新登录。文章发布方式是模拟手动发布。
纸飞机DiscuZ独家采集器升级内容:
1.修改列表页部分不以"A开头的hrefs无法截取的问题。
2、部分网站列表页面的URL会被编码,直接截取无效,会导致测试时出现规则。
没问题,但 采集 不是。添加截获的 URL 进行解码。
3.修复图片重复上传的问题。
4.解决过滤器html卡住的问题。
5、解决目标网站图片为采集的相对路径问题。
6.解决获取的URL列表重复的问题。
7、收录“的标题自动替换为空格,收录”的标题自动替换为双引号。
8. 移除按钮检测,解决论坛发帖时卡顿的问题。9.增加了检测到重复URL列表的问题。
DiscuZ 的纸飞机 采集器 v1.3 更新:
采集 过程中过滤规则无效的问题。
免费的:纸飞机DiscuZ专用采集器
纸飞机DiscuZ专用采集器用于文章采集,分页采集,采集内容过滤超链接,帖子中图像的自动下载,内容关键字过滤和替换,内容尾部自定义添加内容等。
纸飞机DcuZ专用采集器应用平台:
纸飞机磁盘采集器可以在 Windows 2000 或更高版本上运行。需要安装。NET 框架 3.5 框架 .win7 或更高版本的系统不需要下载和安装。经测试支持迪苏兹2.0、迪苏兹2.5。。软件采集规则都是根据网页源代码前后的代码拦截中间部分,所以非常简单。纸飞机DiscuZ特殊采集器主要功能:文章采集分页采集采集内容过滤超链接自动下载帖子中的图像内容....