解读:采集内容插入词库?目前存疑的是:此类插入词
优采云 发布时间: 2022-10-16 13:11解读:采集内容插入词库?目前存疑的是:此类插入词
采集内容插入词库?目前存疑的是:此类插入词数据来源于移动端的哪些app?这些app的最初来源是通过该公司的广告合作的客户(比如央视、通讯社、电台、媒体等),
没看到确切的数据,不过这可能就是一个噱头,几家app新闻源扩充到十几家大平台并不稀奇,但是哪些源上的数据才有参考价值。
热门新闻就是可以卖钱的。目前感觉可能是不可考了。就怕这玩意是互联网公司自己买来的,然后贴到自己的新闻源上。再然后最后不干了又搞成一个“全网扩充词库”。
这应该是一种卖词的模式,这种模式的好处是把在不同源上的新闻列表都能查到,毕竟任何源都有权限查到所有的新闻,不好的地方是对所查到的新闻重复率有要求,字数上有限制。
在获取新闻词库的过程中应该是没有设计这种扩充新闻源的功能,实际的过程应该应该是包括多个源,每个源的新闻可能就有两三条重复,这个在一定程度上来说也是有一定局限性的。
我看见过一篇可以查到热门新闻的。不过是百度新闻源的,不知道其他公司有没有做这样的推广。
中国移动我记得在08年年底,有一个“国家基础设施建设”专项公司,在单位内部也做了一个“国家基础设施建设”专项新闻源。我想楼主肯定看的是这种。