文章句子采集软件(优采云修正判断内容时的一个逻辑问题(一)——优采云QQ空间采集器)
优采云 发布时间: 2021-11-27 16:20文章句子采集软件(优采云修正判断内容时的一个逻辑问题(一)——优采云QQ空间采集器)
优采云QQ空间采集器是一款按关键词批量采集QQ空间登录和聊天的软件。
目前有 2 个 采集 函数:
1. 是日志采集。有很多转载,还有很多原创。可用优采云·原创文章检测器检测和分类原创文章
2.就是说采集。大部分是原创的内容,简洁明了。一页讲15条数据合并成一个文章。取之不尽用之不竭!
使用说明:
只需在网页中输入你要采集的关键词,然后设置采集条件(文章来源,文章发布时间)和排序(根据匹配度),按时间)参数,则采集!
支持自动识别需要采集(log or talk)的栏目,支持批量自动输入关键词(网页设置参数会失效)
发行说明:
版本:v1.66 日期:2013 年 11 月 1 日
1.51:修改试用版逻辑。不再尝试弹出消息框提示文章,而是允许将采集一页搜索结果日志(15)保存到一个文件中。注册版可用采集所有页面
1.6:新添加的记录标题为采集,可以避免下次重复采集的功能
1.61:新增支持自动输入时按时间排序关键词
1.63:新增文章最大字数选项,自动将字数超过设定值的文章分成多篇文章。
1.64:修复QQ空间响应慢时可能卡住的问题
1.66: 增加了忽略英文文章和计算单词时忽略空行
更新记录:
1.1 由于QQ空间搜索结果改版,1.0版程序无效,故升级为1.1进行改版。
1.2 新增指定起始页码及优化功能采集超时判断!
1.23 增加判断内容是否为原创的功能。◆ 随机选取指定数量的句子,判断是否在百度中出现过。重复率:如果有10个句子,重复率为30%,那么只要百度上出现了3个句子,就说明这个文章不是原创!
1.241 修复判断内容的逻辑问题(此问题影响判断准确率降低)。
1.3 主要补充说说采集功能
1.46 修复判断原创无效的问题
1.5:全新升级,界面调整,功能调整增强(如自动识别栏目,自动输入关键词)
1.6:新添加的记录标题为采集,可以避免下次重复采集的功能
1.61:新增支持自动输入时按时间排序关键词
1.63:新增文章最大字数选项,自动将字数超过设定值的文章分成多篇文章。
【关于采集的失败】
(1)如果你的IE浏览器是IE9(可以打开IE浏览器进入菜单栏-帮助-关于项目查看),请卸载ie9(控制面板-安装更新),重启电脑自动恢复对于ie8,QQ空间的采集只能在ie8版本下运行。
(2)另外,QQ空间部分皮肤会导致采集失效,如果第一条已经解决,请恢复默认皮肤或更换新的应用QQ账号登录QQ空间,就可以正常使用了!(下面是恢复默认皮肤的截图)