内容采集器?只要做一个开源的例子看看..

优采云 发布时间: 2022-09-04 09:09

  内容采集器?只要做一个开源的例子看看..

  内容采集器?只要做一个采集器啊试着举一个开源的例子看看...是不是够高大上?以后要想接入百度的api,一是能帮百度端采集内容;二是对接微信端,要有可读的正规出版物的第三方出版机构入站,才能帮app采集...

  

  目前正好在做短视频内容爬虫的用户行为分析推荐,看了一些推荐算法,其实就是基于基因库里的同一份用户数据,然后推算该人在某段时间内看到过的内容,据此预测其大概的观看量,观看时长等。这个需要有足够的内容,然后通过专门的算法将内容分割出来,匹配在合适的位置,这样推荐算法才会正确推荐给用户。你所说的大数据分析技术应该更多是指这个推荐系统。

  个人观点不一定对,但这是目前比较科学的推荐算法,并且基于大数据的推荐算法目前能落地的基本上只有短视频内容,具体可以看一下/这个网站的短视频分析数据,做简单的参考。

  

  大数据是指数据量大,但是实际的应用中数据量是很少的,特别是新闻数据。

  谢邀,同求,

  做传统机器学习算法会比较费时费力,因为机器学习需要同时测试多种特征,需要识别出正相关和负相关等关系,多层次表达式、boosting等特性。如果是面向直接开发人员,可以用大数据,但是理论证明这样做并不科学,花费太多时间精力而且无意义。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线