搜索引擎优化 pdf(如何阻止Google收录我的PDF文件被索引最简单的方法)
优采云 发布时间: 2021-10-15 07:25搜索引擎优化 pdf(如何阻止Google收录我的PDF文件被索引最简单的方法)
谷歌最近在其官方博客上详细解答了很多人关心的PDF文件在SEO中的作用。本问答列出了大家经常问的一些关于PDF的问题,很有参考价值!关于在SEO过程中使用PDF文件,网上流传着一些比较笼统的说法。比较流行的是原创PDF天升PR3,比HTML页面等更容易获得信任和高排名,具体情况如何?没有定论,我们来看看谷歌官方的说法:
问:可以 Google 收录 任何类型的 PDF 文件吗?
A: 通常情况下,我们可以收录 任何没有密码保护或加密的文本内容、PDF 文件。如果文件中的文本是图片格式,我们会使用OCR算法来处理文本。简单的说,只要你有办法将PDF文件中的文字“做成”成普通文档,我们就可以收录这个PDF文件。
问:Google 如何处理 PDF 文件中的图片?
答:PDF 中的图片不会被索引。您最好使用 HTML 页面来显示您的图片。如何让你的图片获得更好的排名,可以参考谷歌帮助中心的相关文档。
问:Google 如何处理 PDF 文件中的链接?
A:一般PDF文档中的链接和HTML文件中的链接效果是一样的:可以传播PR等链接效果,谷歌爬到这些链接的时候也会做同样的“关注记录”(我自己编的,只要如您所知)”处理。目前PDF文档不支持“nofollow”属性标签!
问:如何阻止 Google 收录 我的 PDF 文档;或者文档已经是收录,如何删除索引?
答:防止 PDF 文件被索引的最简单方法是在 HTTP 标头中添加 X-Robots 标签:Noindex。(关于X-Robots,可以参考文档:Google 发布Robots.txt 和抓取索引关键文档,以及Google 官方Robots meta tag 和X-Robots-Tag HTTP header 规范)。对于已经收录的PDF文档,添加Noindex标签后,谷歌会在下次更新时删除。如果想更快的删除,可以到谷歌站长工具后台进行操作。
Q:PDF文件能获得高排名吗?
A:当然,PDF的排名和其他网页差不多。以下是三个例子 [抵押贷款市场回顾]、[2011 年税务报告] 和 [扑热息痛专家报告]。在 Google 上搜索时,PDF 文档排名非常高。非常感谢这些 PDF 文档和其他页面中的高质量内容 链接在这里。
问:如果我的页面同时提供 HTML 和 PDF 格式,是否会出现内容重复的问题?
A:一般情况下,我们建议您只提供相同内容的一份。如果由于某些特殊原因(包括页面展示、文档格式等)必须提供多份副本,则可以使用指定标准化 URL 的方法来防止此问题。可以在网站映射中指定,并设置一些常规的URL标准化指定方法。(标准化问题可以参考文档:URL标准化,也可以参考谷歌官方文档。)
Q:我可以控制搜索引擎中显示的PDF文档的标题吗?
A:我们使用两个元素来确定一个PDF文档的标题,一个是PDF本身的meta标签中的标题设置(Metadata,这些在PDF制作软件中有相应的设置),另一个是链接自的锚点上页文本。为了让搜索引擎更好地确定您的 PDF 文档的标题,最好将这两个方面都标准化。
原文:Google 搜索结果中的 PDF
对于上面的QA,我们关心的有两个问题:
1:关于PDF文件中的链接,大家应该都知道它是一种外链形式,所以PDF文档共享也是增加外链的一种方式。
2:关于PDF排名,谷歌并不强调其先天优势。它的排名参考因素和其他类型的网页一样,没有什么特别之处。
问题是很多人在问为什么在Google上搜索时PDF经常出现在最前面。
如果按照本QA排除这个问题的特殊性,就个人经验而言,PDF文档在国外被引用和传播频繁,很多权威网站都提供了相应的PDF文档,包括一些政府报告。、教育、健康信息等一些高质量的长篇完整文档……看来国内在这方面是不感冒的!因此,您会经常在 Google 主页上看到 PDF。
附件:Matt Cutts 的 PDF 文件优化视频
你需要翻墙去亲眼看看。基本上,谷歌正试图展示更高、更令人满意的结果等等,等等。
附:国外几个常用的PDF上传分享网站:
- 但PDF搜索引擎,你可以试试!