搜索引擎主题模型优化(关键词人文社科基金项目优化热点跟踪客户需求反向优化模型排名)

优采云发布时间: 2021-12-20 11:06

　　计算机应用程序和软件第 30 卷 No. ComputerApplications SoftwareFeb。2013 基于双向热点跟踪的搜索引擎优化模型（河南机电学院河南新乡45300３）收稿时间：2012 06. 教育部人文社会科学基金项目（10YJCZH1 5３）；河南省教育厅科技攻关重点项目（12A52001９）。王国国，讲师，主要研究领域：计算机应用。戴东，讲师。针对当前搜索引擎优化模型的外部热点滥用和其他问题，根据内部客户需求提出热点与搜外引擎进行热点跟踪的优化模型，给出了该模型的组织结构和运行流程，并解释了内部和外部热点跟踪技术的实现细节。模型中使用聚类算法处理客户需求并根据结果进行匹配选择，然后使用反向搜索跟踪外部热点，最终实现搜索引擎优化。实验结果证明，该模型可以提高网站的搜索引擎排名，提高客户满意度。关键词搜索引擎优化热点跟踪客户需求反向搜索中文图书馆分类号TP393 TP391 DOI：10.3969 issn。1000386x。2013. 02. 037 BIDIRECTIONAL HOTSPOT TRACKINGBASED SEARCH ENGINE OPTIMIZATION MODEL Wang Guo Dai Dong (河南机电工程学院，河南新乡453003) Abstract Inorder externalhotspot abusing, optimisedSEO（搜索引擎优化）模型基于internalclient request hotspots externalsearch engine hotspot tracking 提出。组织架构运作流程实施细节跟踪技术内外热点阐述；该模型利用聚类算法处理客户需求，根据处理结果进行匹配选择，利用逆向搜索外部热点，最终实现搜索引擎优化。实验表明，该模型可以很好地提高网站搜索引擎客户的满意度。关键词搜索该模型利用聚类算法处理客户需求，根据处理结果进行匹配选择，利用逆向搜索外部热点，最终实现搜索引擎优化。实验表明，该模型可以很好地提高网站搜索引擎客户的满意度。关键词搜索该模型利用聚类算法处理客户需求，根据处理结果进行匹配选择，利用逆向搜索外部热点，最终实现搜索引擎优化。实验表明，该模型可以很好地提高网站搜索引擎客户的满意度。关键词搜索

　　内部元素的量化和结构化（网站或链接）。在该模型中，将优化后的网页和链接信息进行向量化，提取5类信息进行匹配和聚类：特征信息用于记录网页或链接的本质特征；网页或链接移动后，此类信息仍可作为区别于网站其他元素的特征，主要包括：标题、评论、创建日期等元数据。Logo (关键词) 信息用于记录网页或链接中的关键字，包括：关键词、网页中的热词和相似词。位置信息用于记录网站中网页或链接的层次位置、排名位置、存储地址等；其中，层次位置由网站ドＭ（文档对象模式）树中的非循环路径决定。王国国等：基于双向热点跟踪的搜索引擎优化模型145 上下文信息用于记录网页的相关链接信息和关键词前后的信息（通常分为两种：前导词和后导词）；这类信息往往与网页或关键词的内涵相当相关，例如：提示、注释、扩展、摘要等。基于双向热点跟踪的搜索引擎优化模型145 上下文信息用于记录网页相关链接信息和关键词前后信息（通常分为前导词和后导词两种） ); 这类信息往往与网页或关键词的内涵相当相关，例如：提示、注释、扩展、摘要等。基于双向热点跟踪的搜索引擎优化模型145 上下文信息用于记录网页相关链接信息和关键词前后信息（通常分为前导词和后导词两种） ); 这类信息往往与网页或关键词的内涵相当相关，例如：提示、注释、扩展、摘要等。

　　结构特征记录了网站元素的组织结构特征和内部布局特征，例如：基本布局分为：整页型、分体型、中轴型等；和网页结构特征主要有：导航型、详细型、交互型等。模型结构本模型结构如图1所示。模型结构的关键单元具有以下特点：客户需求处理单元本单元负责对客户提交的各种元素（图片、网页、链接等）注入系统前进行处理，并根据这些元素提取客户的信息需求；其内部处理工作包括：客户输入预处理、输入内容筛选和过滤、客户注入热点分析和跟踪等。最后，该单元将细化的客户需求热点传送到热点处理单元进行存储和处理。反向搜索单元：本单元接收客户需求处理单元、热点发现单元等相关单位提供的热点信息（关键词和链接），向百度、谷歌搜索引擎发送搜索请求，下载相关信息从搜索引擎搜索结果（百度快照和谷歌网页快照），对结果进行聚类和分析，并识别与网站内容相关的近期热点和关注点。站点热点发现单元该单元根据客户需求处理单元和反向搜索单元获取的当前网络热点，对站点后台数据库中的历史信息进行双向发现。第一种挖掘方式是提取站点中最近和当前的热点元素作为“主”元素，提交给热点处理单元；第二种挖掘方式，从历史数据库中提取与当前热点高度相似的信息作为“次要”元素，提交给热点处理单元。

　　热点处理单元本单元接收上述三个单元发送的近期历史站点需求和热点，以及当前网络热点等信息。经过聚类分析和匹配比较，生成三类信息（当前综合热点排序表、站点热点排序表和历史“辅助”元素排序表），提交给站内元素优化单元。站内元素优化单元在接收到热点处理单元发送的三类信息后，对站内元素进行搜索引擎优化，主要包括以下措施：热点关键词集中处理（稀释和浓缩），历史信息再现（搜索引擎通常只能抓取网页，不能抓取数据库内容，因此优化单元必须将相关内容生成到网页中供搜索引擎获取）、自动更新目录页和热门热点等客户需求采集并处理跟踪客户的网站浏览过程，记录客户长时间停留的页面；记录客户的复制、回复、新帖、检索输入、话题采集等活动；并从上述活动中提取客户需求和关注点。反向搜索基于近期网站内部热点和客户需求热点，以及关键词并以其相似词为搜索依据，在百度、谷歌进行外部热点搜索；通过实测可知，百度针对每个Group搜索词提供760个有效页面，Google提供约740个。每个页面的属性特征信息在10K以内，信息处理量控制在2.5GB以内（容量控制在150关键词以内），现有服务器日均处理信息300MB，对网站整体性能影响不大。详细的实验结果请参考以下内容。每个页面的属性特征信息在10K以内，信息处理量控制在2.5GB以内（容量控制在150个关键词以内），现有服务器日均处理信息300MB，具有对网站的整体性能影响很小。详细的实验结果请参考以下内容。每个页面的属性特征信息在10K以内，信息处理量控制在2.5GB以内（容量控制在150个关键词以内），现有服务器日均处理信息300MB，具有对网站的整体性能影响很小。详细的实验结果请参考以下内容。

　　热点处理与匹配将检索到的外部热点和本网站中的内部热点注入热点处理模块；由它进行聚类匹配操作，选取并生成网站内外的兴趣热点：当前综合热点排序表、站点热点排序表、历史“辅助”元素排序表。全文搜索引擎只能搜索网站上已有的文件；如果这些文件放在数据库中，则无法搜索；因此，该模型将根据当前网络热点搜索历史数据库并提交“主辅”信息。除了关键词浓度调整外，这个模型使用提取的“main” 元素作为SEO优化，主要包括：主题词链接自动生成、热点话题自动置顶、搜索列表自动生成等。此外，该模型从数据库中提取信息，生成收录“辅助”元素的页面，并在相关热门页面后添加这些页面的链接，以增加被搜索引擎检索到的概率；并在网站上为客户提供相关的扩展信息，降低搜索难度。反馈根据相关主题的搜索引擎排名变化，以及客户对优化页面的反馈，进一步优化。将聚类匹配算法应用于当前热点元素，必须确定当前热点元素的属性，即将热元素与其他元素匹配。如果两者之间的相似度高于预定阈值，则两者属于同一类型；优化单元会自动对相似元素进行分类和链接；相反，如果一个元素与所有其他元素的相似度低于下限，则将为其分配单独的分类。

　　在这个模型中，使用了聚类增量算法。具体方法是：为了避免将最近的热点与整个站点的所有元素进行比较，增量算法在元素窗口（特定元素队列）中进行循环操作，以减少匹配操作的次数。首先根据建立的元素窗口，通过聚类增量算法对窗口中的所有元素进行处理。然后，将窗口中的所有元素与现有簇进行比较匹配，确定每个新元素的属性（现有簇或根据当前计算结果更新现有聚类结果。处理结束后，重复上述操作）两步，直到所有簇不再变化，再继续下一个元素窗口的处理。在具体的热点元素分类匹配操作中，该模型使用KNN（kNearest Nei*敏*感*词*or）算法去除窗口中的新元素。将所有元素一一匹配比较，通过热点属性（相当于二维数据表的列）组成的特征向量（相当于二维表的行）得到两者的相似度，然后处理相似度最高的几个“邻居”元素：在这k个邻居中，如果某个特征的元素数量最多，则将新元素暂时归入这一类，重新计算聚类模型。在该模型中，特征是使用向量来描述元素，其计算模型为：其中ωjc为调整后的特征向量权重；ωjc 为当前参数值；i 是现有元素的标识符，C 代表最近的热点元素，x ij 是元素 i 计算机应用程序和软件 2013 属性；n为站内现有元素总数，即窗口中正例总数。

　　在热点挖掘算法的实际应用实测中，研究人员发现，大部分网络帖子的字符容量在1KB到1MB之间，字符数比较多；如果所有的字符都作为网元的属性特征，会带来一系列问题：一是大字符串匹配带来的计算和存储资源消耗；其次，太长的字符串收录更多的文本噪声，难以发现真正的关注热点。为了节省系统资源的成本，该模型采用了一种比较成熟的计算特征词权重的方法，即：TFIDF算法。TFIDF算法使用关键词在页面中的频率和收录关键词的页面数的比例在整个系统中作为词的特征值；算法的计算模型为： 01 其中，关键词的权重，TF(t,d)为关键词t在文档d中出现的频率，N代表文档d中的总页数系统（或某个类别）；DF（表示系统中收录t的页数。这个公式计算值的含义是：当一个特定的关键词在某些簇中出现的频率更高，而在其他簇中出现的频率较低时，它可以提供给文档的特定聚类来区分。经过这个过程，结合反向搜索，观察特定关键词在页面上的当前网络排名和客户需求，可以确认文档的流行度，然后深入挖掘网站世界中心的热点。

　　实验测试结果该模型的性能测试通过了网站用户兴趣度量（客户和网站经理）和搜索引擎排名（150组关键词）：用户兴趣度量统计调查通过WEBdiscovery网站自动评测工具，共监控600余位客户和管理人员，共433条有效监控数据；最后监测更新和新网页，该模型与现有SEO模型（结合Trafic Travis CutRank工具使用）应用效果对比见表1。网站的新模型满意度调查项目新旧模式自动评价对比新模式（%）旧模式（%）站点主题的新颖性 81 43 站点主题更新的及时性 92 33 链接引用的充分性79 42 链接引用相关度 81 79 网站信息相关度 72 39 网站信息利用度 77 31 网站搜索效果 81 32的数据表明：与旧的SEO处理模型相比，新的优化模型自动化程度更高，可以根据客户需求自动关联关键词和网页的链接处理更好地同时跟踪社区内外的热点，因此获得了客户和管理满意度高。此外，该模型通过对站内已有信息的挖掘和利用，避免了类似热点信息的“沉淀”。经过20个监测周期（24小时为一个周期），在百度和谷歌两大全文搜索中搜索到该领域的相关主题。以引擎中的 PageRank TopN关键词排名作为基准）。

　　从图中可以看出，模型投入使用后的4个周期内，网站的排名上升较快。在持续优化中，排名经历了几次暂时的下滑，但总体上保持了稳步上升的趋势。新搜索引擎优化模型的排名提升效果系统级SEO面临的最大问题是巨大的资源成本；在仿真实验中，每隔30分钟，从整个网站所在服务器的CPU可以看出，因为采用了先进的模型结构和成熟的数据处理算法。该模型的运行虽然需要一些资源，但对网站系统的整体性能影响不大，系统资源份额并没有增加多少；也从一定程度上证明了该模型具有相当的实用性和可用性。基于双向热点跟踪的搜索引擎优化模型已经过测试，综合性能良好；它可以兼顾内部客户需求和搜外引擎排名需求。同时，实验也发现该模型在关键词和链接的自动处理、网站结构的自组织等方面还存在不足，缺乏针对多个的分布式协同跟踪机制。虚拟社区；后续工作计划有待补充和加强。Computer Engineering and Design, 2011, 32 (１）: 149 143. PageRank 改进了整合反馈信息和内容相关性的计算。鞠彦斌。基于研究搜索引擎优化的 Sigma 管理[C] 国际会议大道。上海，2011，5：1819-1822。何立兴、陆梦煌、李钦培。探索搜索信息优化技术应用互联网信息化信息信息资格,@3ScienceScience,@3:394401. [10]崔萌,胡松云. Search Engagement Optimizatin：研究网站推广信息技术，Comporter0 Engagement0 [11] 张焕景。Research NewMethod SearchEngine Optimization [C] International Conference InternetTechnology Applications, 2010: 1 [12] 何丽兴，黄菊臣，陆梦煌。应用搜索引擎优化网络营销：一个例子 motelwebsites [InternationalConference AutomationEngineering, 2010: 380383。（接第 73 节，

　　在选定的坐标平面上绘制椭圆草图和自由曲线草图后，以椭圆为边界线，以自由曲线为约束线覆盖操作生成自由曲面特征，如图5 （一个）。用户在视图中用鼠标选中地物的特征点后，系统自动获取地物的长L、宽、高H等语义信息及相应的参数信息。语义信息显示在视图中，参数信息显示在对话框中。. 用户在对话框中修改长、宽W、高H的参数值后，系统自动根据新的参数调用相应的模块实现修改，表面特征的重建和显示，同时保持相应的语义信息不变。分别修改L、W、H的值后，重建的表面特征如图5(b)所示。自由曲面特征参数化设计系统可以处理模型设计过程中特征的变化。在图6所示的零件模型中，(A)为初始模型，(b)为特征修改后的模型。当face1消失时，系统可以有效捕捉到face1的消失。这是因为系统采用了新提出的拓扑元素命名和标识机制用于维护用户的设计意图，该机制不仅使用元素的局部拓扑信息，还利用曲面的参数空间信息来命名拓扑元素，并在参数空间信息中保留了特征方向、特征旋转方向等重要的设计信息。拓扑元素识别提供更完整的设计意图信息。

　　对于*敏*感*词*, 陈征明, 赵丽华. NewMethod CLAssifcation ParametricResentation Freeform Surface Feature[J]. The International Journal AdvancedManufacturing Technology, 2011, 11, 57 (1 ４）: 271 283 . 计算机辅助设计与计算机图形学, 2009,21 (８）:.. 11061117 Oneditability featurebaseddesign [J] ComputerAided Design, 1995,27 (1 ２）: 905 914.

0

2021-12-20

搜索引擎主题模型优化

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

搜索引擎主题模型优化(关键词人文社科基金项目优化热点跟踪客户需求反向优化模型排名)

0 个评论

发起人

AI时代内容工厂

搜索引擎主题模型优化(关键词人文社科基金项目优化热点跟踪客户需求反向优化模型排名)

0 个评论

发起人

相关问题