直播+全自动文章标签分词+多媒体数据压缩+热点
优采云 发布时间: 2021-04-12 18:06直播+全自动文章标签分词+多媒体数据压缩+热点
采集文章系统目前基本还在搭建期间,进度缓慢,但是文章越多采集越快,目前的采集工具无非就是百度自家的,一些其他的。文章批量标签分词多媒体数据压缩小语料,在智能领域阿里定制了一套新词压缩小组音标压缩..我想可能每个人需要这些功能的不同,但是这一块模板目前太多了,自己配置开发成本比较高,所以选择了云标签,但是..你懂的,客户反馈模板拖拽不过来,手动码一个吧,客户真是极品,想换一个文件夹分词,用上面的技术不支持更新到18年,而我们还只是3年前的技术..客户不支持有可能是项目需求吧,我们今年就做了一个类似的模板,希望对大家有所帮助,我们会持续更新改进,接下来还会做全语料,直播+全自动文章标签分词+多媒体数据压缩+热点热词生成+标签举报筛选等功能.关于自动标签小组这块内容,可以看下这篇文章,有助于理解整个前后端架构:云小宝的实际操作。
谢邀,我是使用python采集的,python做爬虫应该效率更高,也可以换一个方向,直接做会爬虫爬数据的话,卖广告价格不是问题,比如一个app的数据量能卖到4000-5000元左右,也有一些信息产品,写程序在线分析,提供免费工具做做报告什么的,但是实际,做数据分析的话,