文章句子采集软件(优采云修正判断内容时的一个逻辑问题(一)——优采云QQ空间采集器)

优采云 发布时间: 2021-11-27 16:20

  文章句子采集软件(优采云修正判断内容时的一个逻辑问题(一)——优采云QQ空间采集器)

  优采云QQ空间采集器是一款按关键词批量采集QQ空间登录和聊天的软件。

  目前有 2 个 采集 函数:

  1. 是日志采集。有很多转载,还有很多原创。可用优采云·原创文章检测器检测和分类原创文章

  2.就是说采集。大部分是原创的内容,简洁明了。一页讲15条数据合并成一个文章。取之不尽用之不竭!

  使用说明:

  只需在网页中输入你要采集的关键词,然后设置采集条件(文章来源,文章发布时间)和排序(根据匹配度),按时间)参数,则采集!

  支持自动识别需要采集(log or talk)的栏目,支持批量自动输入关键词(网页设置参数会失效)

  发行说明:

  版本:v1.66 日期:2013 年 11 月 1 日

  1.51:修改试用版逻辑。不再尝试弹出消息框提示文章,而是允许将采集一页搜索结果日志(15)保存到一个文件中。注册版可用采集所有页面

  1.6:新添加的记录标题为采集,可以避免下次重复采集的功能

  1.61:新增支持自动输入时按时间排序关键词

  1.63:新增文章最大字数选项,自动将字数超过设定值的文章分成多篇文章。

  1.64:修复QQ空间响应慢时可能卡住的问题

  1.66: 增加了忽略英文文章和计算单词时忽略空行

  更新记录:

  1.1 由于QQ空间搜索结果改版,1.0版程序无效,故升级为1.1进行改版。

  1.2 新增指定起始页码及优化功能采集超时判断!

  1.23 增加判断内容是否为原创的功能。◆ 随机选取指定数量的句子,判断是否在百度中出现过。重复率:如果有10个句子,重复率为30%,那么只要百度上出现了3个句子,就说明这个文章不是原创!

  1.241 修复判断内容的逻辑问题(此问题影响判断准确率降低)。

  1.3 主要补充说说采集功能

  1.46 修复判断原创无效的问题

  1.5:全新升级,界面调整,功能调整增强(如自动识别栏目,自动输入关键词)

  1.6:新添加的记录标题为采集,可以避免下次重复采集的功能

  1.61:新增支持自动输入时按时间排序关键词

  1.63:新增文章最大字数选项,自动将字数超过设定值的文章分成多篇文章。

  【关于采集的失败】

  (1)如果你的IE浏览器是IE9(可以打开IE浏览器进入菜单栏-帮助-关于项目查看),请卸载ie9(控制面板-安装更新),重启电脑自动恢复对于ie8,QQ空间的采集只能在ie8版本下运行。

  (2)另外,QQ空间部分皮肤会导致采集失效,如果第一条已经解决,请恢复默认皮肤或更换新的应用QQ账号登录QQ空间,就可以正常使用了!(下面是恢复默认皮肤的截图)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线