谷歌的大数据智能应用服务是什么样的体验?

优采云 发布时间: 2021-07-05 22:14

  谷歌的大数据智能应用服务是什么样的体验?

  众所周知,谷歌存储着世界上最大的数据量,数千亿个网页,数百亿张图片。没有数据的支持,谷歌的搜索、播放音乐、图文搜索、翻译、广告、趋势分析等产品将不复存在。但仅靠数据并不能创造出伟大的产品。他们需要更多的外部条件来支撑各种产品的快速稳定运行。谷歌自建硬件,自建硬件系统,开发自有分布式系统软件。通过基础设施和系统设计,海量数据实现真正价值。

  一、Google 搜索引擎平台及大数据分析核心技术

  谷歌开发的定制软件包括面向数据密集型应用的分布式文件系统GFS:谷歌文件系统;用于简化处理和创建*敏*感*词*数据集的编程模型 MapReduce; BigTable 用于结构化数据; Sawzall,一种用于在分布式计算环境中分析*敏*感*词*数据集的解释型编程语言;用于处理分布式系统队列分组和任务调度等的 Google Workqueue

  GFS、MapReduce 和 BigTable 都是谷歌在 2003 年到 2004 年间发布的。从 2009 年开始,谷歌开始尝试新一代技术来优化各种系统和应用程序,取代原有系统。 Caffeine、Pregel、Dremel的出现,再次影响了全球大数据技术的发展趋势。

  Caffeine 是一种基于 Percolator 的增量处理索引系统。它取代了 MapReduce 批量索引系统,并且比 MapReduce 批量索引系统更快。专为BigTable设计的分布式存储Colossus,又称GFS2(Google File System Second Generation),专门用于构建Caffeine搜索索引系统。

  Pregel 主要用于绘制大量在线信息之间关系的“图形数据库”。

  Dremel 是一种分析信息的方式,它可以在数千台服务器上运行,允许“查询”大量数据,例如网络文档集合或数字图书馆,甚至是数百万个垃圾邮件数据描述。

  二、Google 的大数据智能应用服务

  Google 提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测和合法副本分类。

  一些典型的应用如下:

  1. 基于 Map Reduce,谷歌的传统应用包括数据存储、数据分析、日志分析、搜索质量等数据分析应用。

  2. 基于Dremel系统,谷歌推出了强大的数据分析软件和服务——BigQuery,这也是谷歌自己的互联网搜索服务的一部分。谷歌已经开始销售在线数据分析服务,试图在市场上与类似于亚马逊网络服务的企业云计算服务竞争。这项服务可以帮助企业用户在几秒钟内完成万亿字节的扫描。

  3.基于搜索统计算法,谷歌推出了搜索引擎输入和写作纠错、统计机器翻译等服务。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线