云端内容采集(Google的这项服务被称为BigQuery(组图))
优采云 发布时间: 2022-02-08 23:11云端内容采集(Google的这项服务被称为BigQuery(组图))
BigQuery 是谷歌推出的一种网络服务,用于处理云中的大数据。本文简要介绍了 Google BigQuery 以及 BigQuery 在云端使用 SQL 处理大数据的优势。
今天,大数据的话题围绕着本地部署的系统展开,谷歌正在构建服务来分析云中的大数据。谷歌的服务被称为 BigQuery,谷歌产品经理 Ju-Kay Kwek 在最近在纽约举行的 GigaOM 会议上表示,BigQuery 将帮助公司在没有硬件基础设施的情况下分析他们的数据。可以同时建立应用和数据共享的所有服务。
BigQuery 是 Google 推出的一项 Web 服务,它允许开发人员使用 Google 的架构运行 SQL 语句来操作非常大的数据库。BigQuery 允许用户上传大量数据并直接通过它执行交互式分析,无需投资建立自己的数据中心。谷歌表示,BigQuery 引擎可以快速扫描多达 70TB 的未压缩数据并立即获得分析结果。
<IMG alt="Google BigQuery:在云端处理大数据" src="http://img1.gtimg.com/tech/pics/hv1/3/63/1010/65691318.jpg">
但谷歌目前只为少数客户提供服务,何时全面开放服务尚不确定。参与的客户以多种方式测试 BigQuery 服务,客户将他们的数据流上传到服务器,然后通过 Google 的算法和查询语言分析数据。
云模型中的大数据有很多优势,BigQuery 服务不需要组织提供或构建数据仓库。而且 BigQuery 在安全和数据备份服务方面也相当完善。
谷歌高管看到了云时代BigQuery模型的机会,谷歌内部已经开发和使用了相关工具。Kwek 表示,在数据爆炸的时代,(谷歌搜索引擎)索引网页是一个大数据问题。同时谷歌的Gmail也面临同样的问题。谷歌成功的关键是保持它产生的所有数据都是细粒度的。在线广告商通过采集一定范围内的相关数据来做到这一点。例如,用户行为,然后采集这些数据以进行更准确的广告投放。
谷歌产品经理 Ju-Kay Kwek 也表示,新的 BigQuery 服务提供了一个新的 REST API,开发者可以将这个服务编译到他们的代码中,并且可以有效地实现多任务管理和权限控制。查询到的数据表也可以导出到谷歌的云存储服务中。此外,BigQuery 带来了一个新的网络界面,可以更清晰地显示查询结果。