Python架构高薪就业班/爬虫/数据分析/web开发/AI人工智能(百度云 百

优采云 发布时间: 2022-04-29 23:25

  Python架构高薪就业班/爬虫/数据分析/web开发/AI人工智能(百度云 百

  含大数据、前沿技术、前端开发、后端开发、移动开发、数据分析、架构、人工智能、Python、Java、Android、前端、IOS、C++、大数据、、GO、音视频软件测试、产品经理、运维、股票基金、人工智能AI

  

  

  

  以下内容为填充,无视即可

  报表样式的饼图如图13-15所示。可以单击如图13-16所示的链接单独引用此报表。图13-15 报表样式的饼图图13-16 链接报表单独的页面能根据查询的修改而实时变化,比如将查询修改为:select date_format(create_time,'%Y-%m-%d') d, count(*) cfrom information_schema.tableswhere create_time > '2016-06-07'group by date_format(create_time,'%Y-%m-%d')order by d;增加了where子句,再运行此查询,结果如图13-17所示。图13-17 图形显示随查询变化单独链接的页面也随之自动发生变化,如图13-18所示。图13-18 单独链接的页面自动变化13.4 Hue、Zeppelin比较1.功能Zeppelin和Hue都具有一定的数据可视化功能,都提供了多种图形化数据表示形式。单从这点来说,它们的功能类似,大同小异。Hue可以通过经纬度进行地图定位,这个功能在Zeppelin 0.6.0上没有。Zeppelin支持的后端数据查询程序较多,0.6.0版本默认有18种,原生支持Spark。

  而Hue的3.9.0版本默认只支持Hive、Impala、Pig和数据库查询。Zeppelin只提供了单一的数据处理功能,它将数据摄取、数据发现、数据分析、数据可视化都归为数据处理的范畴。而Hue的功能则丰富得多,除了类似的数据处理,还有元数据管理、Oozie工作流管理、作业管理、用户管理、Sqoop集成等很多管理功能。从这点看,Zeppelin只是一个数据处理工具,而Hue更像是一个综合管理工具。2.架构Zeppelin采用插件式的翻译器,通过插件开发,可以添加任何后端语言及其数据处理程序,相对来说更加独立和开放。Hue与Hadoop生态圈的其他组件密切相关,一般都与CDH一同部署。3.使用场景Zeppelin适合单一数据处理,但后端处理语言繁多的场景,尤其适合Spark。Hue适合与Hadoop集群的多个组件交互,如Oozie工作流、Sqoop等联合处理数据的场景,尤其适合与Impala协同工作。13.5 数据可视化实例本节先用Impala、DB查询示例说明Hue的数据查询和可视化功能,然后交互式地建立定期执行销售订单示例ETL任务的工作流,说明在Hue里是如何操作Oozie工作流引擎的。

  1.Impala查询在12.4节中执行了一些联机分析处理的查询,现在在Hue里执行查询,直观看一下结果的图形化表示效果。登录Hue,单击 图标进入“我的文档”页面。单击 创建一个名为“销售订单”的新项目。单击“新文档”→“Impala”进入查询编辑页面,创建一个新的Impala文档。在Impala查询编辑页面,选择olap库,然后在编辑窗口输入下面的查询语句。-- 按产品分类查询销售量和销售额selectt2.product_category pro_category,sum(order_quantity) sum_quantity,sum(order_amount) sum_amountfromsales_order_fact t1, product_dim t2wheret1.product_sk = t2.product_skgroup bypro_categoryorder bypro_category;-- 按产品查询销售量和销售额

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线