人工采集慢,手动比较慢手动手动
优采云 发布时间: 2021-08-07 06:04人工采集慢,手动比较慢手动手动
一是人工采集,二是智能采集.人工采集比较慢,手动比较慢,上个星期刚做了一个月才采集了3000多条图片.智能采集就简单多了,用googleanalytics,或者百度统计就可以做到,
图片数据来源无非三种方式,收集(原始存储和云端保存)、分析(报告)、买卖。用来存储的服务器成本问题比较大,比如买好的服务器存储,大多数人买过之后用十几个月就要淘汰。分析的话普通公司做不了这个,和交易单位的价格以及能力等相关。买卖的话相对来说最省钱,同样的预算能买个性能不错的内存服务器,再配置好的硬盘,这样的话性能在公司运算中非常重要。
上文提到的收集服务器比较昂贵,如果不是特别特别着急用的话,没有必要购买。如果着急用,就先分析出来。报告的话其实没有太多好说的,很多事先能够做到的报告有什么不能在上面做到呢?卖给客户而已。
首先,说说收集,可以大致分为两种,一种是主动收集,一种是被动收集。一个是信息来源已有,也就是信息的收集是经由用户主动收集。另一种是信息来源是不完全,也就是信息的收集是来源于用户收集的结果,再通过信息组合而成。其次,说说分析。除了收集的,其他还会有是报告的分析,财务分析,人力资源分析,市场分析等等。再次,说说买卖。
说起来就很复杂,因为不同行业,不同公司,不同使用场景的数据量都是不同的。我们接触最多的就是图片数据,无论从信息获取的自然属性来说,还是信息存储的时间要求来说,都是比较好分析并进行金融行业价值挖掘的。第一种就是最基础的,传统硬盘或是磁带录制,硬盘一般是5t以上,磁带也是50-200g不等。在速度上来说硬盘要比磁带快很多,但从收费方面来说,普通磁带价格相对较低。
第二种是需要采集收集信息的。比如图片收集,信息采集。这类需要专门有人采集来收集信息,这些人一般都是在某个行业工作多年的行业专家,或者是工程师,这些专家以前一般都工作在单位的高端网络公网,有一定的技术积累。这类收集信息的人,一般都是看过无数图片,收集经验多,此类收集和分析的软件功能基本都比较接近。第三种就是以图片作为数据源的。
这类数据一般多为图片数据库,比如百度图片,谷歌图片,这类数据源适合进行精准广告,如果感兴趣的话,可以深入了解一下。未完待续。