原创智能优化,原创度检查,一键采集,文章组合(天池大型网络电商数据集(2018年11月12日更新))
优采云 发布时间: 2022-02-23 05:01原创智能优化,原创度检查,一键采集,文章组合(天池大型网络电商数据集(2018年11月12日更新))
原创智能优化,原创度检查,一键采集,文章组合,在线压缩、在线群发、内容监测。
一、背景:近年来随着电商的快速发展,在线购物已经是一种现代化的购物形式,在上你几乎想买到的任何东西都有销售。随着购物的热潮持续升温,数据就成为了业务部门关注的重点,对于分析师和业务部门来说,数据有着越来越大的意义。虽然我们数据还在不断的增加,但我们所能够拿到的数据已经无法满足业务需求,数据来源也越来越多,什么行业的,消费者人群,什么级别的,甚至什么时间、什么地点,数据量越来越多,这些对我们进行数据分析将会提出更多挑战。
以一个简单的例子,消费者有去年的生活和交通数据,但是业务部门并不会告诉你这些数据,这些数据还不是特别详细,你也不清楚这些数据的关系,这时候就需要我们自己去想办法去获取这些数据。针对这些问题,我们就需要做出一套完整的数据分析方案,一套全面的数据分析方案。
二、数据来源:在线购物(没有pc)首先我们从阿里云天池的官网上获取,天池大型网络电商数据集(2018年11月12日更新)该数据集包含2万条记录,22个字段,字段名为user_id:用户idauction_id:购买行为编号cat_id:商品种类idcat1:商品属于哪个类别property:商品属性buy_mount:购买数量day:购买时间该数据集有着108个字段,其中auction_id是唯一的有效字段,每一行记录中包含1条用户对商品的购买行为记录,用户id、商品id和商品属性都被作为字段描述,他们之间用\**/表示。
三、业务分析:对表lucidcount进行业务分析(lucidcount中只包含有效用户,所以相同的用户数据可以用在不同的表格中)字段解析:此数据集的字段非常的少,那么我们首先要做的就是对它进行分析,进而了解这个分析背后的意义。1.针对评论数量字段的分析表:lucidcount数据集中有很多字段,从用户角度分析就是,商品的评论数量和销量,电商评论又分为5个子集(在当前数据集中):用户评论的评分/好评/差评/中评/差评之和/feedback_to_store的评分/是否与在线购物网站合作,用户喜欢在网站上购买哪种商品,等。
从商品角度看,商品的销量,以及商品类目,是其中最重要的两个参数。从用户角度看,用户的评论就是评论的数量和相应的商品,这两个角度所指的关系,应该是递增的关系,用户相应的商品,在购买相应商品时,相应评论出现的频率越多,该商品相应的销量越高。用户评论对购买商品和商品评分的影响:评论对商品来说,直接影响用户的购买意向和选择,对商品来说,则直接影响用户的。