优采云采集器主要功能、支持的内容管理系统有哪些?怎么收费?

       优采云采集器是一个根据用户提供的关键词,云端自动采集相关文章并发布到用户网站的网站采集器。它能够自动识别各种网页上的标题、正文等信息,不需要用户编写任何采集规则就可以实现全网采集。采集到内容后,会自动计算内容与所设定的关键词的相关度,只把相关的文章推送给用户。支持智能标题、标题前缀、关键词自动加粗、插入固定链接、自动提取Tag标签、自动内链、自动配图、自动伪原创、内容过滤和替换、电话号码和网址清理、定时采集、百度主动提交等一系列SEO功能。用户只需设置好关键词和相关需求,就能实现全托管、零维护的网站内容更新。不限网站数量,不管是单个网站还是大批量站群,都可以非常方便的进行管理。
百科封面.png

研发背景
       文章采集器是多数网站管理员必备的网站更新工具,传统的采集器在对网页信息进行提取时,主要基于正则表达式对网页内容进行匹配,运行速度快,实现难度低,但不同的网站具有不同的页面结构,需要编写不同的采集规则,工作量大,难于维护。而且需要用户自己寻找采集源,还需要用户自己挂机运行采集器,甚至还涉及可能被封IP,需要使用代理IP等一系列问题。
主要功能
        在上述背景下,优采云于2016年上线,实现功能如下:
  1. 提供一个1亿+量级的庞大关键词库,可根据用户输入的任意文本进行关键词搜索,经过简单勾选就能用于采集,大幅缩减了用户搜集关键词的时间和精力。
  2. 用户也可以创建自己的私有词库,可分库分组,数百万关键词轻松管理,也满足更个性化的关键词需求。
  3. 按关键词采集文章,基于百度、搜狗、好搜等搜索引擎,全网采集精美好文,用户不必为寻找采集源而花费精力。
  4. 自动识别网页编码、标题、正文等信息,不用为每个网站设置不同的采集规则,更不用到处找人写采集规则,不必懂得html源码,完全零维护。
  5. 可设定需求的正文长度,比如500字,750字,1000字,长度不达标的内容自动舍弃。
  6. 系统内置多种自然语言处理算法,自动计算文章正文和关键词的相关度(特征向量间的余弦距离),把相关度低的文章自动过滤掉,只把相关度高的文章留给用户。
  7. 自动计算文章正文的通顺度(语言困惑度),把通顺度低的文章舍弃,通顺度高的文章留给用户。
  8. 自动计算标题(Title)和描述(Description)与关键词的相关度,如果相关度低,可在标题和描述中自动插入关键词,以提升相关度。还可以为标题设定前缀关键词,每次在设定的多个前缀中随机选取一个添加在文章标题头部。
  9. 基于机器学习算法实现的文本鉴黄,可对采集的内容进行内容审核,保障用户内容安全。
  10. 实现基于同义词替换的伪原创功能,从2000万对近义词库中选择最符合语言表达习惯的词,替换原文中的词,最大限度保证文章可读性。
  11. 实现基于机器学习的智能AI伪原创,先把原文编码为高维语义向量,再通过解码器逐字解码,实现对整篇文章的完全重写,伪原创程度高,可读性好。
  12. 自动提取Tags标签,并在此基础上实现自动内链,当正文中出现标签对应的文本时,为该文本加上一个站内文章的链接,指向一篇具有同样主题的文章,实现自动化的科学有效的内链建设。
  13. 也可以设置固定的链接,当正文中出现某些固定文本时,为它加上固定的链接,指向站内或站外的文章均可。
  14. 根据文章内容自动配图,让你即使是采集的文章也能图文并茂。
  15. 可设置图片本地化或者使用远程图片,以及屏蔽所有图片。
  16. 可设置屏蔽某些网站不采集,或包含某些特定词的内容不采集。
  17. 自动过滤联系方式、网址以及文章前后的广告性内容等冗余信息,并进行全部标签清理,正文部分只保留<p>段落标签和图片<img>标签,无任何乱码,也不包含任何排版格式,方便用户通过css样式自定义外观。
  18. 严格的防重复机制,整个平台每个网址只采集一次,不重复采集。同一网站下,相同标题的文章只采集一次,不重复采集。
  19. 可指定每个关键词允许采集的文章数量,实现大量长尾关键词不重复布局。
  20. 云端自动运行采集任务,可定时定量采集,用户不用在自己电脑上安装任何软件,不用挂机采集,甚至不需要打开浏览器。
  21. 采集后自动发布到用户网站后台,用户只需要把接口文件下载并上传到网站根目录就能完成对接。
  22. 采集后自动执行百度主动推送,让蜘蛛快速发现你的文章。

支持程序
        截至2020年7月,优采云已支持以下内容管理系统:
  1. 织梦内容管理系统(DEDECMS)
  2. 帝国网站管理系统
  3. 社区动力DISCUZ(论坛版)
  4. Z-BLOG
  5. WordPress
  6. 老y文章管理系统
  7. EMLOG
  8. MIPCMS
  9. 凡科网(凡科建站)
  10. 易优企业建站系统(EYOUCMS)
  11. 米拓建站(MetInfo)
  12. 江湖CMS
  13. 微连云
  14. PHPCMS
  15. DESTOON(B2B网站系统)
  16. 口号帮营销系统

计费方式
        采用预充值+积分扣除制度,充值比例1元=100积分,多充多送。积分扣除以篇为单位,对于基础的采集功能,每篇只扣除1积分;如果选择了某些高级功能,会造成每篇单价升高,在每个这样的设置后面,都有红色字体备注积分消耗情况,也可以使用积分消耗计算器查看。
        单笔充值500元以上,自动激活VIP,终生享伪原创功能半价特权!
继续阅读 »

如何使用优采云采集文章发布到WordPress博客

   博主想要批量采集大量文章怎么办?手工复制粘贴早就out了,古人云:“工欲善其事,必先利其器“,今天小编跟大家聊聊如何使用优采云采集文章发布到WordPress博客。
第一步:注册和登录
  优采云目前只能通过邀请注册,获取邀请的方式有两种:
    1. 关注优采云公众号(ucaiyun_com),或者扫码下方二维码,回复您的有效邮箱,然后根据系统提示完成注册。
logo_weixin.jpg

aa89c54720fd747d7c55d88a3a9ea626.jpg

  2. 通过加入用户交流群574685687,或扫描下面的二维码,加群后向群内其他用户索取邀请。
logo_qq_qun.png

请牢记您注册时使用的邮箱、用户名、密码。注册成功后,使用PC端浏览器登录优采云。
第二步:添加网站域名
    为了能把采集到的文章推送给您的网站后台,我们需要知道您的网站域名,并验证所有权。
   1. 进入管理控制台,点击左侧边栏“站点管理”,再点击“添加网站”。
   2. 在输入框中输入网站域名,点击“下载验证文件”,将下载到的文件上传到网站根目录,点击“开始验证”,显示验证OK后点击“提交按钮”。
3.png

    如果您希望采集到文章后手动复制到其他地方,请联系管理员为您添加临时域名。
第三步:接口文件安装
    进入管理控制台,点击左侧“接口文件相关”,优采云目前默认的文章接收方式有很多,请选择WordPress,然后下载对应的鉴权接口和发布接口2个文件,上传到您网站的根目录测试OK即可。我们采集到文章后将通过接口文件推送给您的网站并保存到您的数据库,您可以直接在网站后台进行所有管理操作。
2.png

第四步:添加网站栏目绑定关键词
    优采云是按关键词采集文章,不需要要手动添加目标网站,也不需要手动编写采集规则,每个网站的每个栏目只需要绑定一些关键词就能运行采集任务,不但能采集百度上最新的文章,还能采集热点新闻。
栏目1.png

栏目2.png

第五步:采集细节设置
    细节设置主要是为了满足不同的采集需求,设置每一个参数。任何一个新添加到本平台的网站,都必须手动点击细节设置页面底部的保存按钮,参数才会生效,采集任务才会运行。为确保采集效果符合您的需求,请您务必仔细阅读每个参数的说明文字。
细节.png

第六步:测试采集结果
测试.png

第七步:开启采集,无需挂机,实现云端采集。
采集2.png

以上操作完成后即可开始采集,优采云拥有海量数据,等您来采。
继续阅读 »

优采云采集器计费方式

1. 本系统目前只按篇计费,基础采集只需要1积分每篇,某些高级功能会增加费用,都有红色字体备注,也可以通过积分消耗计算器查看。
2. 充值比例1元=100积分,单次充值500元以上自动激活VIP,终生享伪原创功能半价特权;单次充1000以上送20%,单次充5000以上送50%。
3. 由于本系统是计算密集型服务,采集服务非常消耗服务器资源,如果包年包月不限采集量,我们的服务无法维持,如果限制采集量,也就失去了包年包月的意义。 因此,本着“一分钱一分货”的精神,我们目前暂不提供包年包月套餐。
继续阅读 »

指定采集目标网站设置方式变更说明

        指定采集目标网站的设置,此前一直依赖于私有词库,在上传词库的时候设定目标网站域名,存在的弊端较多,非常不灵活,现将此设置改到栏目设置上,原词库上传界面不再设置目标网站。
私有词库上传不再设置目标网站.png

目标网站设置改到栏目设置界面.png

注意事项:
  1. 原私有词库已经设置的目标网站继续有效,但如果在栏目设置界面再设置目标网站,则会覆盖私有词库的设置。
  2. 如果私有词库没有设置目标网站,且栏目设置界面也没有设置,则进行全网采集。
  3. 改版后的目标网站设置,不再局限于私有栏目,所有类型的栏目都可以设置。
  4. 改版后的目标网站设置,可以同时设定多个目标域名,使用空格分隔,总字符长度255以内即可。
  5. 同时,原时效性采集设置下线。

继续阅读 »

“接口文件已安装,但鉴权失败”的常见原因及解决方法

部分用户在安装接口文件时,得到“接口文件已安装,但鉴权失败”的错误提示,这里给出三个常见的原因,请用户自查:
1.  本来想要为A网站安装接口文件,但是实际下载的是B网站的接口文件,并上传到了A网站的根目录。这种情况下不仅A网站会报鉴权失败,同时也会造成B网站的接口鉴权失败。
解决方法:注意在下载接口文件时正确选择网站域名,选择好后重新下载接口文件上传即可:
选择域名.png

 
2.  对于已经正确安装了接口文件的网站,如果再次下载接口文件,一旦点击下载按钮,优采云内部会自动更新授权码,如果此时没有把新下载文件上传,就会造成鉴权失败。
解决方法:下载最新的接口文件正确上传即可。
 
3.  如果您的服务器时间与标准北京时间相差超过10小时,也会收到鉴权失败的提示。
解决方法:把您的服务器时间设置为与北京时间同步。
 
继续阅读 »

系统文章发布服务器IP变更公告

因业务升级,系统文章发布服务器IP将由47.104.18.67变更为60.247.148.23,系统将在2021-10-20 12:00:00自动切换,切换后将获得一项新技能!如果您的网站有防火墙,请尽快将新IP加入白名单。在切换前,系统暂时保留原IP,因此请不要删除原IP的白名单;如果您已完成新白名单设置,可以告知管理员,及早获得新技能。
随机延时发布.png

新增技能介绍:允许文章采集后在同时段内随机时间发布,而不是立即发布,避免多篇文章发布时间太过集中。既可以避免集中发布对网站服务器造成压力,又利于SEO。
继续阅读 »

采集后的图片如何上传到阿里云OSS? 阿里云OSS上传信息填写说明

首先打开优采云采集细节设置页面,找到“图片处理方式”设置项。
图片处理.png

点击“上传云存储”选项,会看到展开的云存储信息设置框,然后在设置框内选择“阿里云OSS”。
设置框.png

一、AccessKey ID和AccessKey Secret的填写,先在阿里云控制台,鼠标指向右上角头像,在弹出的菜单中点击“访问控制”菜单。
RAM访问控制.png

在RAM访问控制台左侧,选择“用户”菜单,然后点击“创建用户”选项。
RAM用户.png

在创建用户页面,填写一个新用户名,并勾选“Open API调用访问”,创建用户。
创建用户.png

创建成功后,会显示对应的AccessKey ID和AccessKey Secret,复制粘贴到优采云设置中即可。
创建成功.png

二、Bucket填写,在阿里云OSS控制台左侧栏,选择Bucket列表,然后选择一个bucket的名称,填到优采云设置中。
bucket.png

三、上传目录填写,上传目录是用于指定把图片上传到bucket空间下的某个目录,可以是一个一级目录,如:ucaiyun,也可以是一个多级目录,如:ucaiyun/a/b
四、Bucket域名,在bucket列表中点击对应的bucket名称,然后在左侧栏选择“概览”:
bucket域名1.png

找到bucket域名,填到优采云设置。
bucket域名2.png

五、访问域名,是指图片上传成功后,需要生成一个外网可以访问的图片网址,替换文章中原来的图片网址。可以直接填写Bucket域名。如需自定义,请在所对应的bucket管理页面左侧栏,选择“传输管理”,然后查看或绑定域名,并把域名填到优采云设置中,注意只填域名,不需要加"http://"或者"https://"
访问域名.png

六、以上信息填写完后,请点击下方“上传测试”按钮,优采云系统将尝试上传一个图片到您的bucket中,如果上传成功,将显示生成的图片网址:
上传测试.png

如果上传失败,将显示阿里云OSS返回的错误信息:
上传失败.png

 
继续阅读 »

采集后的图片如何上传到腾讯云COS? 腾讯云COS上传信息填写说明

首先打开优采云采集细节设置页面,找到“图片处理方式”设置项。
图片处理.png

点击“上传云存储”选项,会看到展开的云存储信息设置框,然后在设置框内选择“腾讯云COS”。
选择腾讯云COS.png

一、SecretId和SecretKey的填写,先在腾讯云控制台,鼠标指向右上角头像,在弹出的菜单中点击“访问管理”菜单。
腾讯访问管理.png

在访问管理页面左侧栏,选择“API密钥管理”,然后新建一个密钥,把生成的填到优采云设置中。
腾讯云密钥.png

二、存储桶名称,在腾讯云COS控制台左侧栏选择“存储桶列表”,在列出的存储桶中选择一个填到优采云设置中。
存储桶名称.png

三、上传目录填写,上传目录是用于指定把图片上传到存储桶下的某个目录,可以是一个一级目录,如:ucaiyun,也可以是一个多级目录,如:ucaiyun/a/b
四、源站域名填写,在所选择的存储桶管理页面左侧栏,选择“概览”,然后在右侧域名信息框找到“访问域名”,填到优采云设置中,注意只填域名,不需要加"http://"或者"https://"
源站域名.png

五、访问域名,是指图片上传成功后,需要生成一个外网可以访问的图片网址,替换文章中原来的图片网址。可以直接填写源站域名。如需自定义,请在所对应的存储桶管理页面左侧栏,选择“域名与传输管理”,然后查看默认CDN加速域名、自定义 CDN 加速域名或自定义源站域名,并把域名填到优采云设置中,注意只填域名,不需要加"http://"或者"https://"
访问域名.png

六、以上信息填写完后,请点击下方“上传测试”按钮,优采云系统将尝试上传一个图片到您的存储桶中,如果上传成功,将显示生成的图片网址:
上传成功.png

如果上传失败,将显示腾讯云COS返回的错误信息:
上传失败.png

 
 
继续阅读 »

采集后的图片如何上传到七牛云存储? 七牛云存储上传信息填写说明

首先打开优采云采集细节设置页面,找到“图片处理方式”设置项。
图片处理.png

点击“上传云存储”选项,会看到展开的云存储信息设置框,然后在设置框内选择“七牛云存储”。
选择七牛.png

一、AccessKey(AK)和SecretKey(SK)的填写,先在七牛云控制台,鼠标指向右上角头像,在弹出的菜单中点击“密钥管理”菜单。
密钥管理.png

在密钥管理页面查看密钥,填到优采云设置中。
查看密钥.png

二、空间名称,在七牛云控制台左侧栏选择“空间管理”,在列出的空间中选择一个填到优采云设置中。
空间管理.png

三、上传目录填写,上传目录是用于指定把图片上传到存储空间的某个目录,可以是一个一级目录,如:ucaiyun,也可以是一个多级目录,如:ucaiyun/a/b
四、上传域名填写,根据空间所在区域,在七牛云存储区域列表查询对应的源站上传域名或加速上传域名,填到优采云设置中,注意只填域名,不需要加"http://"或者"https://"
存储区域1.png

上传域名.png

五、访问域名,是指图片上传成功后,需要生成一个外网可以访问的图片网址,替换文章中原来的图片网址。在存储空间管理页面,选择“域名管理”,然后查看自定义 CDN 加速域名或自定义源站域名,并把域名填到优采云设置中,注意只填域名,不需要加"http://"或者"https://"
域名管理.png

六、以上信息填写完后,请点击下方“上传测试”按钮,优采云系统将尝试上传一个图片到您的存储空间中,如果上传成功,将显示生成的图片网址:
上传成功.png

如果上传失败,将显示七牛云返回的错误信息:
上传失败.png
继续阅读 »

官方客服QQ群