为什么我设置了几个栏目,但是只有一个栏目采集到文章?

优采云 发布时间: 2020-06-18 15:46
        优采云同一个网站里不同栏目的采集策略是随机的,在短时间里,不同栏目的文章数可能不同,但是时间稍微长一点,这个文章数会趋于均等,因为每个栏目被采集到的概率是一样的。        但是有用户反映,我设置了几个栏目,每个栏目都绑定了不同的词库,好几天过去了,还是只有一个栏目采集到文章!
        我们针对上述问题进行了调查,造成该问题的原因是:
        用户最先只添加了一个栏目,然后运行了一段时间采集,由于只存在一个栏目,系统后台积累了数百个同栏目的网址等待采集。
        在这种情况下,当用户再添加其他栏目的时候,系统会优先采集已有的网址,等待已有网址采集完毕,新添加的栏目才有机会参与随机采集。如果用户设置的每小时需求量很少,那么已有的网址可能需要好几天才能被采集完,在此期间用户看到的现象就是,只有一个栏目采集到文章。
 
        因此,如果遇到上述问题,不要着急,安心等待即可。
        有人会问,系统为什么要积累那么多网址?
        这样做的目的是,尽可能多的缓存网址,这些网址是来自不同的关键词,然后采集的时候随机调用其中一个网址,这样一来,同一个关键词被连续采集的概率就会变小,利于用户的内容多样性,降低堆砌风险。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线