谷歌的大数据智能应用服务是什么样的体验?
优采云 发布时间: 2021-07-05 22:14谷歌的大数据智能应用服务是什么样的体验?
众所周知,谷歌存储着世界上最大的数据量,数千亿个网页,数百亿张图片。没有数据的支持,谷歌的搜索、播放音乐、图文搜索、翻译、广告、趋势分析等产品将不复存在。但仅靠数据并不能创造出伟大的产品。他们需要更多的外部条件来支撑各种产品的快速稳定运行。谷歌自建硬件,自建硬件系统,开发自有分布式系统软件。通过基础设施和系统设计,海量数据实现真正价值。
一、Google 搜索引擎平台及大数据分析核心技术
谷歌开发的定制软件包括面向数据密集型应用的分布式文件系统GFS:谷歌文件系统;用于简化处理和创建*敏*感*词*数据集的编程模型 MapReduce; BigTable 用于结构化数据; Sawzall,一种用于在分布式计算环境中分析*敏*感*词*数据集的解释型编程语言;用于处理分布式系统队列分组和任务调度等的 Google Workqueue
GFS、MapReduce 和 BigTable 都是谷歌在 2003 年到 2004 年间发布的。从 2009 年开始,谷歌开始尝试新一代技术来优化各种系统和应用程序,取代原有系统。 Caffeine、Pregel、Dremel的出现,再次影响了全球大数据技术的发展趋势。
Caffeine 是一种基于 Percolator 的增量处理索引系统。它取代了 MapReduce 批量索引系统,并且比 MapReduce 批量索引系统更快。专为BigTable设计的分布式存储Colossus,又称GFS2(Google File System Second Generation),专门用于构建Caffeine搜索索引系统。
Pregel 主要用于绘制大量在线信息之间关系的“图形数据库”。
Dremel 是一种分析信息的方式,它可以在数千台服务器上运行,允许“查询”大量数据,例如网络文档集合或数字图书馆,甚至是数百万个垃圾邮件数据描述。
二、Google 的大数据智能应用服务
Google 提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测和合法副本分类。
一些典型的应用如下:
1. 基于 Map Reduce,谷歌的传统应用包括数据存储、数据分析、日志分析、搜索质量等数据分析应用。
2. 基于Dremel系统,谷歌推出了强大的数据分析软件和服务——BigQuery,这也是谷歌自己的互联网搜索服务的一部分。谷歌已经开始销售在线数据分析服务,试图在市场上与类似于亚马逊网络服务的企业云计算服务竞争。这项服务可以帮助企业用户在几秒钟内完成万亿字节的扫描。
3.基于搜索统计算法,谷歌推出了搜索引擎输入和写作纠错、统计机器翻译等服务。