内容采集器(继承3.1的优点,站点+任务式管理,多任务多线程)
优采云 发布时间: 2021-11-08 17:16内容采集器(继承3.1的优点,站点+任务式管理,多任务多线程)
继承3.1、站点+任务管理的优点,多任务多线程同时运行
以下是3.2正式版新增功能的简单列表:
采集网址、采集内容、发布内容三个步骤可以一步步分开。
增加缩略图采集功能,并可保存到本地文件
添加多页采集,使采集多页下载链接或产品多页图片、参数、评论、价格内容成为可能
添加自定义网页编码类型。默认任何编码页面都可以进行内部转换,并且可以正确采集,发布时请选择目标UTF8
增加循环采集(采集列表和论坛回复列表类似网页)
增加将循环采集的匹配结果添加为新记录并除以间隔符的功能
添加在内容采集中使用正则匹配的功能
添加WEB发布配置,保存每个网站的发布配置,单个任务可以发布到多个网站,但任务可以发布到网站的不同列
增加数据库发布模块,去掉之前的数据库直接引导配置,成熟的发布模块可以让不了解数据库结构的人也可以使用数据库直接引导
增加分页采集功能自定义地址格式,改进前分页采集中上10页和后10页,就是不能采集@的问题>
添加源代码查看和测试工具
增加软件中的动态帮助,使用更方便。
为任意采集标签中的内容添加自动生成摘要和自动拼音的功能
增加保存到本地SQL文件的功能(3.1中未完成),完善各种在线发布和数据库发布功能
改进下载算法,让下载任意格式的图片等文件更快更稳定
还有编辑和重新发布本地任务数据的功能,
自动获取标签(生成中文关键词功能),
自动英文->中文翻译功能,
任务定时自动更新功能,
任何格式的文件下载功能,
(ACCESS, MYSQL, MSSQL) 数据库发布模块编辑器
以高级版本发布,如果您需要这些高级功能或获得更多技术支持,请访问:链接
3.2 SP2 版本更新内容 [200709-26]
新增调用迅雷或FlashGet等成熟下载组件下载文件功能(高级版已集成此功能)
增加自动关机功能
增加内置浏览器自动抓取POST包的功能
添加 Shift+S 软件显示/隐藏热键
添加了阻止默认缩略图的功能
增加了[随机值]标签,比如从自定义作者中随机选择一个作者
新增设置内容中第一张图片为缩略图的功能
增加发布内容的间隔时间(之前采集和发布间隔是一样的)
增加了添加采集起始地址的预览功能
新增确认起始采集地址中的地址并删除功能
增加了每次发表文章数量上限功能,适合多次更新少量内容
修复 SP1 中删除的地址库和任务库失效的问题
修复标签编辑框中添加或编辑标签后的自动排列功能
修复采集过程中或全局配置长时间打开时,对象引用未设置到对象实例的bug。
固定排除