电子商务网站推广之搜索引擎优化策略研究(侦测垃圾网站常用的搜索引擎优化方法及应用方法介绍-乐题库)
优采云 发布时间: 2022-01-19 21:03电子商务网站推广之搜索引擎优化策略研究(侦测垃圾网站常用的搜索引擎优化方法及应用方法介绍-乐题库)
《垃圾网页SEO技术研究》会员分享,可在线阅读。更多相关的《垃圾网页SEO技术研究(8页珍藏版)》,请搜索人人图书馆。
1、 垃圾网页搜索引擎优化技术研究总结:搜索引擎排名是垃圾网页自我宣传的主要方式之一。本文首先介绍了搜索引擎对搜索结果进行排名的基本策略,并提出了常用的垃圾邮件搜索引擎优化方法网站,为进一步研究垃圾邮件检测的相关技术和方法提供帮助网站. 关键词:搜索引擎排名策略搜索引擎优化CLC编号:tp393 文档识别码:a文章编号:1007-9416(2011)11-0124-021、搜索引擎排名策略 在使用互联网搜索引擎的过程中,当用户使用搜索引擎查询信息时,85% 的机会只会查看搜索引擎查询结果的前 10 名结果。什么样的数据信息会出现在前10条结果中,这取决于搜索引擎使用的排名策略。搜索引擎主要使用的排名策略
2、根据用户使用搜索引擎在互联网上查找信息的两个关键点,即预期被搜索的网站内容的相关性和重要性以及搜索到的关键词 (关键字)(重要性)。1.1 Relevance(相关性) 搜索引擎用来搜索关键词related网站的技术,在信息检索中一般使用tfidf(词频逆文档频率)的概念,即,网页内容与搜索关键词w的相关性有关。tfidf 是一种常用的信息检索和信息挖掘加权技术。tfidf的主要思想是:如果一个词出现在一个tf值较高的文章中,而该词或词组在其他文章中出现的频率较低,
3、,适用于信息分类。tfidf其实是:tf表示w在网页所有词中出现的次数,即词频,;idf(w)表示w在所有网页的集合中,取收录w的网页个数为倒数,即逆文档频率(inverse document frequency)。网页的 tfidf 值越高,在搜索结果中的排名就越高。1.2 重要性除了根据网页上出现的关键词字数进行排名外,搜索引擎还提出使用网页链接(推荐)作为计算网页重要性的排名技术pages,其中最广泛使用的算法分别是hit和pagerank。
4、值,表示具有重要hub值的网页必须指向很多重要的权威网页;许多枢纽网页指向重要的权威网页。而pagerank(page level,谷歌搜索引擎排名算法的排名计算理论一)来源于:一个网页的重要性来自于其他重要网页的推荐,而一个网页的重要性也会延伸到它所链接的网页。根据m.bianchini、m.gori等人的研究,发现pagerank算法的计算公式可能如下: 其中c表示阻尼因子c(0, 1),通常设置为0.85,代表px页面会被py页面点击的概率,
5、对总数进行排名。一般来说,pagerank值越高的页面排名越高。2、搜索引擎优化技术(seo,search engine optimization)其实是针对各个搜索引擎的排名算法而设计的,其主要作用是篡改一个网页在搜索引擎的排名。对于围绕互联网虚拟市场开展营销服务的电子商务企业而言,搜索引擎营销已成为互联网营销应用的重要领域。企业通常使用搜索引擎来提高网站的访问率,并使用搜索引擎来展示公司的品牌信息。并将产品信息传递给在线消费者,从而提高品牌知名度和产品销售业绩。2.
6、搜索引擎营销,首先要建立企业产品信息或品牌信息等相关网页,形成信息源,然后通过各种方式将这些信息发布到互联网上。可以使用的手段包括:创建企业营销网站、利用行业信息平台或其他第三方信息发布平台、撰写博客文章、在知名网站发布网络广告、发布在论坛。然后让搜索引擎通过搜索策略收录信息或支付搜索引擎收录信息,将企业营销数据信息添加到搜索引擎的索引库中。当用户输入 关键词 进行检查时,企业营销信息作为搜索结果反馈给在线消费者。然而,一些垃圾网站利用搜索引擎排名策略,篡改他们在搜索引擎中的网站排名,以增加网站的知名度。根据z.gyongui和h.garcia-molina的研究,主要是
7、分为提升技术和隐藏技术两大类。2.2 Boosting 技术(boosting 技术) 该技术主要用于提高网页的排名。它是为上述搜索引擎排名方法而设计的。根据技术不同,可以分为:2.2.1 Spamming 关键词(term spamming) 从前面提到的tfidf页面排名方法可以看出,2.的次数< @关键词 出现在页面中(词频)会影响其排名位置。因此,search spammer(web spammer、spammer)利用这个特性将关键词放在页面的不同位置,如:页面正文(body)、标题(title)、meta标签
8、标签、html head(网页头部标签)、url、anchor text(链接锚文本)等都是可以进行搜索引擎优化的地方。另外,放置关键词的方法也不同。最基本的就是添加大量重复的关键词来增加页面的主题;此外,使用复制其他弱主题或更相关的信息。最小化网页内容并插入垃圾邮件词并将其粘贴到您自己的网络垃圾邮件中。这样,一方面可以在短时间内完成一个网络垃圾邮件,另一方面可以稀释垃圾邮件。网页(网络垃圾邮件)出现在网页中以避免搜索引擎检查的速度;或者在不同的字段中放入大量不相关的关键词,
9、看到这个垃圾网站。2.2.2 顾名思义,link spmming 就是针对前面提到的基于链接的搜索算法 hits 或 pagerank 设计的搜索引擎排名 Spamming 技术可以简单地分为两类:(1)@ >外链。垃圾邮件发送者在知名网站链接中添加大量链接,以增加垃圾页面的枢纽价值。由于许多目录网站对每个主题都有明确的分类,相关链接在分类,复制目录的内容 网站 是垃圾邮件发送者用来快速建立大量外链的最常用方法。(2)外链(
10、传入链接)。传入链接也称为外部链接,主要是通过其他网页指向垃圾网页,以增加权限值或pagerank值。2.3 隐藏技巧(hiding technique) 隐藏技巧(hiding technique)主要是隐藏提升分数(boosting)的技巧,主要是因为欺骗搜索引擎的伎俩很容易被肉眼发现,垃圾邮件网页 垃圾邮件发送者因此开发了一些隐藏的方法。2.3.1 内容隐藏 内容隐藏的目的是希望隐藏关键词或垃圾链接的诡计。最基本的方法是通过删除网页中的垃圾邮件
11、将文本颜色设置为与背景相同的颜色。例如:隐藏文本2.3.2 Cloaking是一种黑帽seo技术。垃圾邮件发送者会设计两个不同的网页,分别用于普通用户的网络爬虫。为网络爬虫设计的垃圾网页会尽可能放置大量的垃圾文字和垃圾链接,以欺骗网络爬虫,让搜索引擎提高其页面排名。遇到普通用户时,直接转发广告网页,达到广告宣传的效果。网络爬虫除了比对预先建立的搜索引擎ip列表,还可以通过用户http请求消息中的user-agent fie来识别
12、ld 显示发出请求的浏览器类型。例如:get/db pages/member.html http/1.0host:user-agent:mozilla/4.0(compatible;msie6.0;windows nt 5. 1)2.3.3 重定向除了上面的隐身技术,更直接的方法是在用户连接垃圾页面的时候,直接重定向到广告页面,垃圾页面本身还是负责误导搜索引擎,实现重定向有两种方式,第一种是使用meta标签的功能参数,语法如下: 上面的方法太简单了,所以比较起来,第一种使用的两种方法精通编程的垃圾邮件发送者更常使用脚本程序。
13、爬虫不执行脚本程序,所以使用脚本程序不仅可以达到重定向的目的,而且它的隐私性更高,更难被发现。3、Spam网站Detection Method Conceptual Spam网站篡改排名的方法分为spamming关键词(term spamming)技术和link spmming技术,所以,对策垃圾邮件检测还可以分为:基于内容的垃圾邮件检测技术、基于链接的垃圾邮件检测技术和综合垃圾邮件检测技术三种方法。通过使用垃圾邮件检测技术,减少垃圾邮件对 Web 用户的影响。参考文献1张玉芳,彭世明,吕佳。基于文本分类的tfidf方法的改进与应用 上海:计算机工程
14、Cheng.2006(10):76-78.2m.k.jon, 超链接环境中的权威来源, j.acm, 46(1999) ,pp.604-632.3l.page,s.brin,r.motwani 和 t.winograd,pagerank 引文排名:给网络带来秩序,斯坦福数字图书馆技术项目,1998. 4m.bianchini,m.gori and f.scarselli,inside pagerank, 锡耶纳大学,2003.5王璞,陶建文.电子商务网站搜索引擎优化(seo)策略研究,计算机知识与技术, 2009, 26(5):7404-7405.6 张秀英. 搜索引擎产业发展与搜索引擎优化策略研究. 技术与产业, 2011, 6(11)@ >: 16 -19.7z.gyongui 和 h.garcia-molina,网络垃圾邮件分类,最火的网络对抗性信息检索国际研讨会(airweb05),2005.