解读:如何进行关键词挖掘?
优采云 发布时间: 2022-10-17 13:24解读:如何进行关键词挖掘?
大家好,我是黄大思,今天我们来聊聊关键词挖矿。
关键词搜索一下,想必大家都用过吧。比如你想买一部手机,当你不确定要买什么样的手机时,你可以搜索“什么牌子的手机好?” “华为手机呢?” “3000元左右的手机推荐”、“华为mate50和iphone13哪个好?” 这些都是关键词,通过这些关键词搜索,你会看到很多相关的信息,其实这些信息大部分都是为了吸引流量而发布的。
在绝大多数行业,做网络推广和挖掘关键词都可以通过站长工具、词库、5118以及搜索引擎搜索框的下拉菜单、相关搜索等工具快速锁定。
关键词用工具挖掘,然后结合自己的业务,进行关键词筛选。例如,如果您进行公司体检,您将排除个人和其他类型的 关键词。你的服务是面向本地的,排除其他地方的关键词等,注册选中的关键词表格,然后根据关键词的受欢迎程度进行排序分类( 关键词 索引)。一般建议SEO优化的关键词指标不要太高。如果指数低于100,请使用第三方平台进行推广。如果索引低于300,结合网站进行优化。如果指标在300以上,如果确实需要,结合SEM等方法进行推广。
关键词 工具可以用于挖矿,但不能完全依赖。尤其是一些新兴的蓝海行业,很难用工具挖掘出准确的目标词,挖掘机会普遍较少。比如我之前接触过的黄大司安行业,建筑资质加盟,是一个比较新的行业。用工具挖出来的词很少(原因后面会讲),能用的就更少了。我应该怎么办?这时候就要根据自己的业务来扩词了。
先锁定核心业务词“建筑资质特许经营”,然后列出相关同义词,例如“建筑资质特许经营”也称为“建筑资质特许经营分公司”,然后展开前缀,一般有“地区词”, “品牌词”等。然后展开后缀,一般有“比较词”、“价格词”、“疑问词”以及相关优势的描述等,然后将它们组合起来,比如“哪个建筑资质加盟好”和《武汉建筑资质加盟》,让你得到很多Goal关键词,这是一个词扩展模板,基本适用于全行业。
关键词挖矿不是单一的方法。在大多数情况下,需要多种词挖掘方法的组合,统计、排序、筛选、排序、分类,然后根据推广渠道进行部署。
解读:一文读懂元数据管理!
在数字时代,企业需要知道自己拥有哪些数据,数据在哪里,谁负责,数据中的价值意味着什么,数据的生命周期是什么,数据安全和隐私需要如何受保护的,谁使用数据,用于什么业务目的,数据质量如何等。这些问题都需要通过元数据管理来解决。如果没有有效的元数据管理,企业的数据资产可能会成为拖累企业利润的“包袱”。
— 01 — 什么是元数据?
元数据是关于数据组织、数据域及其关系的信息。简而言之,元数据是描述数据的数据。对于没有 IT 背景的人来说,概念总是生涩、抽象且不易理解。这里有一些例子。
例1:歌词元数据中收录一首80后耳熟能详的歌曲《小芳》。歌词里有一句话:“村里有个姑娘叫小芳,长得好看又善良。” 分析。姓名:小芳;性别:女孩(女);*敏*感*词*、数据之间的关系、业务规则、数据源等。元数据可以使用5W1H模型来理解,如表16-1所示:
表 16-1
— 02 — 元数据类型
根据不同的应用领域或功能,元数据一般可以大致分为三类:业务元数据、技术元数据和运营元数据。1、业务元数据业务元数据描述了数据的业务含义和业务规则。通过明确业务元数据,使业务元数据更易于理解和使用。元数据消除了数据的歧义,让人们对数据有一致的理解,避免“自说自话”,进而为数据分析和应用提供支持。常见的业务元数据有:
2.技术元数据技术元数据是数据的结构化,便于计算机或数据库识别、存储、传输和交换数据。技术元数据可以为开发者服务,让开发者更清楚数据的存储和结构,从而为应用开发和系统集成打下基础。技术元数据还可以为业务人员服务,通过元数据理清数据关系,让业务人员更快地找到自己想要的数据,进而分析数据的来源和去向,支持数据沿袭追溯和影响分析。常见的技术元数据有:
3、操作元数据 操作元数据描述了数据的操作属性,包括管理部门、管理负责人等。定义管理属性有利于对部门和个人的数据管理责任,是数据安全管理的基础。常见的操作元数据有:
— 03 — 元数据管理的目标 企业元数据管理的本质是有效利用企业数据资产,实现数据价值的最大化。元数据管理可以帮助业务分析师、系统架构师、数据仓库工程师、软件开发工程师等相关利益相关者清楚地了解企业拥有哪些数据,存储在哪里,如何提取、清洗、维护这些数据,并指导用户使用它。以下元数据管理目标对企业来说很常见。1、建立指标解读体系,满足用户对业务和数据理解的需求,建立企业内部知识传承的标准信息承载平台,建立业务分析知识库,实现知识共享。能够回答以下问题:
典型应用:数据资源目录、业务词汇表
2.提高数据追溯能力,让用户清楚了解数据仓库中数据流的来龙去脉、业务处理规则、转换条件等,提高数据追溯能力,支持数据仓库的增长需求数据仓库,减少人员变动带来的影响。3、数据质量审计系统通过非冗余、非重复的元数据信息提高数据的完整性和准确性。元数据管理解决的问题是如何对业务系统中的数据进行分类管理,建立告警和监控机制,在发生故障时及时发现问题,为数据的数据质量监控提供基础材料仓库。
— 04 — 元数据管理技术 从技术上看,元数据管理技术主要包括元数据采集、元数据管理、元数据应用和元数据接口。
1.元数据采集
在数据治理项目中,常见的元数据包括数据源元数据、数据处理元数据、数据仓库或数据主体数据库元数据、数据应用层元数据和数据接口服务元数据。元数据采集服务提供各种适配器来满足上述元数据的采集需求,对元数据进行整合处理后存储在中央元数据仓库中,实现对元数据的统一管理。在这个过程中,data采集适配器非常重要。元数据采集不仅要能适应各种数据库、各种ETL、各种数据仓库和报表产品,还要适应各种结构或半结构化的数据源。(1)关系型数据库使用元数据适配器采集来自数据库表结构,视图,Oracle、DB2、SQL Server、MySQL、Teradata 和 Sybase 等关系数据库的存储过程和其他元数据。关系型数据库一般都提供元数据的桥梁,比如Oracle的RDBMS,可以快速读取元数据信息。(2) 2. NoSQL数据库元数据采集工具应该支持来自NoSQL数据库的元数据,如MongoDB、CouchDB、Redis、Neo4j、HBase等。NoSQL数据库适配器大多使用自己的能力来管理和查询Schema。(3)数据仓库对于主流数据仓库,可以根据其固有的查询脚本定制开发相应的适配器,对其元数据执行采集。例如 MPP 数据库 Greenplum,其核心元数据存储在 pg_database、pg_namespace、pg_class、pg_attribute 和 pg_proc 表中,其元数据可以是 采集 通过 SQL 脚本。Hive 表结构信息存储在外部数据库中,Hive 提供了 show table 和 describe table 等语法来查询其元数据信息。当然,也可以使用专业的元数据采集工具来采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 Hive 表结构信息存储在外部数据库中,Hive 提供了 show table 和 describe table 等语法来查询其元数据信息。当然,也可以使用专业的元数据采集工具来采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 Hive 表结构信息存储在外部数据库中,Hive 提供了 show table 和 describe table 等语法来查询其元数据信息。当然,也可以使用专业的元数据采集工具来采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 而 Hive 提供了 show table 和 describe table 等语法来查询其元数据信息。当然,也可以使用专业的元数据采集工具来采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 而 Hive 提供了 show table 和 describe table 等语法来查询其元数据信息。当然,也可以使用专业的元数据采集工具来采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 专业元数据采集工具也可用于采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 专业元数据采集工具也可用于采集数据仓库系统的元数据。(4) 云中的元数据 随着公有云的成熟,通过提供安全的云连接,使用云企业元数据管理作为核心 IT 基础设施的扩展已成为现实,特别是在中小企业之间。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 通过提供安全的云连接,将云企业元数据管理用作核心 IT 基础架构的扩展已成为现实,尤其是在中小企业中。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器 通过提供安全的云连接,将云企业元数据管理用作核心 IT 基础架构的扩展已成为现实,尤其是在中小企业中。基于云的企业元数据管理通过各种上下文改善了对信息的访问,并将实时元数据管理、机器学习模型和元数据 API 推送到流数据管道中,以更好地管理企业数据资产。(5) 其他元数据适配器
当然,市面上的主流元数据产品都无法做到“通用适配”,在实际应用过程中或多或少都需要定制化开发。
2.元数据管理
从技术角度来说,元数据管理一般包括元数据模型管理、元数据审计、元数据维护、元数据版本管理、元数据变更管理等功能。(1)元模型管理元模型管理是基于元数据平台构建符合CWM规范的元数据仓库,实现对元模型的统一集中管理,提供查询、增删改查、元数据关系管理、和元模型的权威。设置等功能,支持概念模型、逻辑模型、物理模型的采集和管理,让用户直观了解现有元模型的分类、统计、使用、变更追溯,以及每个元模型的生命周期管理。同时支持应用开发的模型管理。支持元模型的全生命周期管理。元模型生命周期中存在三种状态,即:设计状态、测试状态和生产状态。
通过元数据平台对应用开发的三种状态进行统一管理和对比分析,可以有效降低元数据变更风险,为下游ODS和DW数据应用提供支撑。(2)元数据审计 元数据审计主要是审计采集到元数据仓库但还没有正式发布到数据资源目录的元数据。审计过程支持数据验证,修复了一些问题,如缺少语义描述、缺少字段、类型错误、缺少编码或无法识别的字符编码等。 (3) 元数据维护 元数据维护是添加、修改、删除、查询、发布基本信息、属性、依赖关系、依赖关系、信息对象的组合关系和其他元数据。创建数据目录,打印目录结构,根据目录发现和查找元数据,查看元数据的内容。元数据维护是最基本的元数据管理功能之一。技术人员和业务人员都使用此功能查看元数据的基本信息。(4) 元数据版本管理 当元数据处于比较完整和稳定的时期,或者在里程碑结束时,可以将元数据定稿发布基线版本,以便日后对差异或错误的元数据进行审核. 可追溯性、检查和回收。(5) 元数据变更管理 用户可以自行订阅元数据。当订阅的元数据发生变化时,系统会自动通知用户,用户可根据指引在系统中进一步查询变更的具体内容及相关影响分析。元数据管理平台提供元数据监控功能。一旦元数据被监控,它会尽快通知用户。
3.元数据应用
(1)数据资产图谱 根据数据域对企业数据资源进行全面盘点和分类,根据元数据字典自动生成企业数据资产全景图。该地图会告诉您哪些数据可用、在哪里可以找到以及如何处理这些数据。数据资产图支持以拓扑图的形式直观展示各种元数据和数据处理过程,并通过不同层次的图形进行粒度控制,满足不同业务应用场景的图形化查询和辅助分析需求:
图:数据资产映射示例
(2)元数据血缘分析元数据血缘分析会告诉你数据从哪里来,经过了怎样的处理。其价值在于当发现数据问题时,可以通过数据的血缘关系进行溯源,快速定位问题数据的来源和处理过程,减少数据问题排查分析的时间和难度.
图:元数据血缘分析示例
(3)元数据影响分析 元数据影响分析会告诉你数据去了哪里,做了哪些处理。它的价值在于,当发现数据问题时,可以通过数据的关联关系进行追溯,快速找到哪些应用程序或数据库使用了该数据,从而将数据问题的影响降到最低。该功能常用于分析数据源元数据变化对下游ETL、ODS、DW等应用的影响。血脉分析是向上追溯,影响分析是向下追溯。这就是这两个函数的区别。(4)元数据冷度分析元数据冷度分析会告诉你哪些数据是企业常用的,哪些数据是死数据。它的价值在于可视化数据的活动水平,使企业内的业务人员和管理人员可以清楚地看到数据的活跃程度,从而更好地管理数据,处置或激活死数据,提供数据的自助分析。提供支持。(5)元数据关联分析元数据关联分析会告诉你数据与其他数据之间的关系,以及它们之间的关系是如何建立的。关联度分析是从与一个实体相关联的其他实体和所涉及的处理过程的角度来看待特定数据的使用情况,形成一个实体网络和参与的处理过程,例如表和ETL程序、表和分析应用程序,表与其他表的关系等,进一步了解实体的重要性。
4.元数据接口
建立统一的元数据查询和访问接口规范,使企业核心元数据完整、准确地提取到元数据仓库中,进行集中管理和统一共享。元数据接口规范主要包括接口的编码方式、接口响应、接口协议、接口安全、连接方式、技术实现、调用方式、消息格式等。
最后的话
数据已成为提升企业竞争力的核心要素,有效管理和使用数据已成为企业的刚需。越来越多的企业使用元数据管理工具来管理在云计算、物联网、数据湖中产生的数据,使人们更容易理解、更高效地查找和管理企业数据,从而实现数据的价值。