php禁止网页抓取(Html营销中常见的META标签的组成及其作用。。)
优采云 发布时间: 2021-10-09 22:31php禁止网页抓取(Html营销中常见的META标签的组成及其作用。。)
Html Mate标签的常见功能是网页HTML源代码中的一个重要代码“”(即所谓的META标签)。META标签用于描述一个HTML网页文档的属性,如作者、日期时间、网页描述、关键词、页面刷新等,META标签是HEAD区域的关键标签的 HTML 标签。它位于 HTML 文档的和之间(有些不在和之间)。虽然它提供的信息对用户来说是不可见的,但它是文档最基本的元信息。除了提供文档字符集、语言、作者等基本信息外,还涉及到关键词和页面排名的设置。所以,搜索引擎标注、搜索引擎优化排名等网络营销方式的内容通常都是讨论META标签的作用,我们甚至可以说META标签的内容设计是搜索引擎营销的关键因素。合理利用Meta标签的Description和Keywords属性,添加网站的关键词或网页关键词可以让网站更贴近用户体验。从HTML代码示例中可以看出,一段代码中收录meta的地方有3个,meta不是独立存储的,必须与其他属性连接,如description、keywords、http-equiv等. 合理利用Meta标签的Description和Keywords属性,添加网站的关键词或网页关键词可以让网站更贴近用户体验。从HTML代码示例中可以看出,一段代码中收录meta的地方有3个,meta不是独立存储的,必须与其他属性连接,如description、keywords、http-equiv等. 合理利用Meta标签的Description和Keywords属性,添加网站的关键词或网页关键词可以让网站更贴近用户体验。从HTML代码示例中可以看出,一段代码中收录meta的地方有3个,meta不是独立存储的,必须与其他属性连接,如description、keywords、http-equiv等.
下面简单介绍一下搜索引擎营销中一些常见的META标签的组成和作用。其中一个HTML代码示例,其功能是指定当前文档使用的字符编码为gb2312,即简体中文字符。根据这行代码,浏览器可以识别出这个网页应该以简体中文显示。同样,如果把“gb2312”改成“big5”,就是我们熟悉的繁体字了。这是元标记最常见的功能。我们在制作网页时会在纯HTML代码下看到它。它的作用是定义网页的语言。当浏览者访问您的网页时,浏览器会自动识别并设置它。网页的语言,如果您的网页设置为国标码,但浏览器未安装国标码,则网页将仅显示浏览器设置的浏览器默认语言。同样,如果页面是英文的,则 charset=en。下面是一个有代表性的例子: 此代码表示网页的语言设置为国标代码。如果想让自己的网页不可控,可以在指定时间内自动访问指定网页,可以使用meta标签的网页自动刷新功能。下面我们来看一段代码: <meta http-equiv="refresh" content="2; URL=此代码可以使当前网页在2秒后自动跳转到该页面。这是meta、content的刷新功能,其中2代表设置的时间(以秒为单位),
metameta是html语言头部区域的辅助标签。在几乎所有的网页中,我们都能看到类似下面一段的html代码: <head> <meta http-equiv="content-Type" content="text/html; charset=gb2312" ></head> 也许你认为这些代码是可有可无的。事实上,如果你能很好地利用meta标签,它会给你带来意想不到的结果。比如添加关键词会被大搜自动采集网站;您可以设置页面格式并刷新。一、meta标签的组成meta标签有两个属性,分别是http-equiv属性和name属性。不同的属性有不同的参数值。这些不同的参数值实现了不同的网页功能。1. name属性 name属性主要用于描述网页,对应的属性值/为内容。content中的内容主要用于搜索引擎机器人查找信息和分类信息。meta标签的name属性的语法格式为:<meta content="specific parameter value"> name属性主要有以下几个参数: A、Keywords(关键字)描述:keywords 用./告诉搜索引擎你的网页的关键词是什么。
相当于http的文件头功能。它可以向浏览器返回一些有用的信息,帮助其正确准确地显示网页内容,对应的属性值为content,content中的内容其实就是各个参数的变量值。
meta标签的http-equiv属性的语法格式为:<meta http-equiv="parameter" content="parameter variable value">;http-equiv 属性主要有以下参数: A、Expires(term) 说明:是 用于设置网页的过期时间。一旦页面过期,就必须将其重新传输到服务器。用法:<meta http-equiv="expires" content="Fri, 12 Jan 2001 18:18:18 GMT" >注意:必须使用 GMT 时间格式。B. Pragma(缓存模式)说明:禁止浏览器访问本地计算机缓存中的页面内容。用法:<meta http-equiv="Pragma" content="no-cache"> 注意:使用此设置,访问者将无法离线浏览。C.刷新(refresh)说明:自动刷新并指向新页面。用法: <meta http-equiv="Refresh" content="2; URL=" >注意:2表示停留2秒后会自动刷新到URL。D. Set-Cookie(cookie设置)说明:如果网页过期,保存的cookie将被删除。
用法:<meta http-equiv="Set-Cookie" content="cookievalue=xxx; expires=Friday, 12-Jan-2001 18:18:18 GMT; path=/"> 注意:必须使用 GMT 时间格式。E. Window-target(显示窗口的设置) 说明:强制页面当前窗口作为单独的页面显示。用法: <meta http-equiv="Window-target" content="_top" >注意:用于防止其他人在框架中调用自己的页面。F. Content-Type(设置显示字符集) 说明:设置页面使用的字符集。用法: <meta http-equiv="content-Type" content="text/html; charset=gb2312" > 二、meta标签功能上面我们介绍了meta标签的一些基本组成部分,接下来一起来看看看一下meta标签的常用功能: 1. 帮助首页被各大搜索引擎登录。meta标签的一个很重要的功能就是设置关键词,帮助你的主页被各大搜索引擎登录,并提出关于网站数量的问题。在这个功能中,最重要的是关键字和描述的设置。
因为根据搜索引擎的工作原理,搜索引擎首先会派机器人自动检索页面中的关键字和描述,并添加到自己的数据库中,然后根据密度对网站进行排序关键词。因此,我们必须设置关键字来提高页面的搜索点击率。举个例子供大家参考:<meta content="政治、经济、科技、文化、健康、情感、灵魂、娱乐、生活、社会、商业、交通"> <meta content="政治、经济、科技、文化, Health, Emotion, Mind, Entertainment, Life, Society, Enterprise, Transportation">设置这些关键词后,搜索引擎会自动将这些关键词添加到数据库中,并根据这些关键词的密度进行适当的排序。2. 定义页面的语言。这是元标记最常见的功能。在制作网页时,我们会在纯HTML代码下看到它。它的作用是定义网页的语言。当浏览者访问您的网页时,浏览器会自动识别并设置网页语言。如果您的网页设置了国标码,而浏览器没有安装国标码,那么网页将只显示浏览器设置的浏览器默认语言。同样,如果页面是英文的,则 charset=en。下面是一个有代表性的例子: <meta http-equiv= 〃content-Type 〃content= 〃text/html; 字符集=gb2312 〃>
3. 自动刷新并指向新页面。如果想让自己的网页不受控制,可以在指定时间内自动访问指定网页,可以使用meta标签的网页自动刷新功能。下面我们来看一段代码: <meta http-equiv= 〃refresh 〃content= 〃2; URL= 〃> 这段代码可以让当前网页在2秒后自动跳转到该页面。这是meta中的刷新功能,内容,2代表设置的时间(以秒为单位),url为指定时间后自动连接的网页地址。4.实现网页转换时的*敏*感*词*效果。使用元标记。我们还可以实现在进入或离开网页的瞬间的*敏*感*词*效果。我们只需要在<之间添加如下代码 head > </head > 页面html代码中的标签。向上: <meta http-equiv="Enter" content="revealTrans(duration=5.0, transition=20)"> <meta http-equiv="Exit" content="revealTrans(duration) =5.0, transition=20)"> 上面的代码添加到一个网页后,进入和退出页面时会看到一些特殊的效果,这个功能其实是一样的FrontPage2000 /Page Transition中的格式是一样的,但是要注意添加的网页不能是Frame页面; 5. 网页评分评价 IE4.0及以上浏览器可以防止浏览一些受限的网站,而浏览器之所以自动识别某些网站是否被限制是因为网站的级别已经在<
12-Jan-2001 18:18:18 GMT 〃> 7. 控制网页上显示的窗口。我们也可以使用meta标签来控制网页显示的窗口,只要在网页中添加如下代码:<metahttp-equiv="window-target" content="_top">,这段代码可以防止网页被其他人称为框架。
8.刷新(refresh)说明:让网页自己刷新多久(秒),或者让网页自动链接到其他网页的时间。用法:注意:5表示停留5秒后会自动刷新到URL。9.过期(Expires)说明:指定网页缓存中的过期时间。一旦网页过期,必须在服务器上重新读取。用法: 注意:必须使用GMT的时间格式,或者直接设置为0(数字表示晚了多少时间)。10、Pragma (cach mode) 说明:禁止浏览器从本机缓存中读取页面内容。使用方法: 注意:网页不保存在缓存中,每次访问都会刷新页面。使用此设置,访问者将无法离线浏览。11、 Set-Cookie(cookie设置)说明:当浏览器访问某个页面时,会将其存储在缓存中,下次再次访问时可以从缓存中读取,以提高速度。如果您希望访问者每次都刷新您的广告图标,或每次都刷新您的计数器,请禁用缓存。通常,没有必要禁用 HTML 文件的缓存。对于ASP等页面,可以禁用缓存,因为每次看到服务器动态生成的页面,缓存就没有意义了。如果网页过期,保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。它将存储在缓存中,下次再次访问时可以从缓存中读取,以提高速度。如果您希望访问者每次都刷新您的广告图标,或每次都刷新您的计数器,请禁用缓存。通常,没有必要禁用 HTML 文件的缓存。对于ASP等页面,可以禁用缓存,因为每次看到服务器动态生成的页面,缓存就没有意义了。如果网页过期,保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。它将存储在缓存中,下次再次访问时可以从缓存中读取,以提高速度。如果您希望访问者每次都刷新您的广告图标,或每次都刷新您的计数器,请禁用缓存。通常,没有必要禁用 HTML 文件的缓存。对于ASP等页面,可以禁用缓存,因为每次看到服务器动态生成的页面,缓存就没有意义了。如果网页过期,保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。s 图标,或每次刷新您的计数器,禁用缓存。通常,没有必要禁用 HTML 文件的缓存。对于ASP等页面,可以禁用缓存,因为每次看到服务器动态生成的页面,缓存就没有意义了。如果网页过期,保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。s 图标,或每次刷新您的计数器,禁用缓存。通常,没有必要禁用 HTML 文件的缓存。对于ASP等页面,可以禁用缓存,因为每次看到服务器动态生成的页面,缓存就没有意义了。如果网页过期,保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。保存的 cookie 将被删除。用法: 注意:必须使用 GMT 的时间格式。12、Window-target(显示窗口设置) 说明:强制页面当前窗口作为单独的页面显示。
用法: 注意:此属性用于防止其他人在框架中调用您的页面。内容选项:_blank、_top、_self、_parent。Head 中的一些其他用法 1. Scheme 描述:scheme 可以在 name 用于指定如何解释 content 的值时使用。用法:注意:2.链接说明:文件链接用法:注意:很多网站如果你把她保存在收件箱里,你会发现它伴随着一个小图标,如果你再次点击进入,你会还可以在地址栏中找到一个小图标。现在只要把这一段添加到你的页眉中,就可以轻松实现这个功能。它用于将当前文档与其他 URL 链接,但不会有链接按钮。它用于标签之间。格式如下: 3. Base(基础链接)描述:插入网页的基础链接属性。用法: 注意:
使用 Meta 的提示: Meta 标签是一种用于描述网页属性的语言。标准的Meta标签可以方便搜索引擎的排名,提高搜索引擎的权重排名网站。如果你想让网站更符合搜索引擎标准,你必须了解meta标签。可惜下面Seoer会讲一下meta标签的含义和用法: 1. META标签的关键词写的是:meat标签的关键词。信息参数表示什么是网站的关键词。2. META标签的Description meta标签的信息参数,代表了描述网站的主要内容,什么是概览。3. META标签的http-equiv=Content-Type content="text/htmlhttp-equiv=Content-Type表示HTTP头协议,提示浏览器网页的信息,meta标签的描述参数如GB2312。, 代表说明网站是简体中文使用的编码;当meta标签的描述信息参数为BIG5时,代表描述网站为使用的编码为繁体中文;meta标签的描述信息参数如for iso-2022-jp,表示网站是日文使用的编码;当meta标签的描述参数为ks_c_5601时,表示网站使用的编码是韩文;meta标签的描述为当meta标签的信息参数如ISO-8859-1时,表示使用的编码为英文;当meta标签的描述信息参数为UTF-8等时,代表通用语言编码;4.generatormeta标签的generator的信息参数,代表描述网站
5、META标签的meta标签的作者信息参数代表作者关于网页版权的信息。6. META 标签的 http-equiv="Refresh"。meta标签的Refresh代表网页自动刷新的时间,Url中的URL参数代表自动链接到其他网址需要多长时间。7、META标签的HTTP-EQUIV="Pragma" CONTENT="no-cache"表示禁止浏览器访问本地计算机缓存中的页面内容,使查询者无法离线浏览。8、META标签的COPYRIGHTmeta标签的COPYRIGHT信息参数表示网站的版权信息。9. META标签的http-equiv="imagetoolbar"指定是否显示图片工具栏,为假时表示不显示,为真时表示显示。1 0、META 标签的 Content-Script-Type W3C 网页规范指示页面中脚本的类型。11、META标签的Revisit-afterrevisit-after代表网站权重,7天代表7天,以此类推。1 2、META 标签的 RobotsRobots 代表告诉搜索引擎机器人将抓取哪些页面。属性描述如下: information 参数为all:将检索文件,可查询页面上的链接;信息参数为none:文件不会被检索,页面上的链接也无法查询;信息参数是索引:文件将被检索;信息参数如下:可查询页面上的链接;信息参数为noindex:不会检索文件,但可以查询页面上的链接;信息参数为nofollow:不会检索文件,可以查询页面上的链接。1 3、META标签的代表页面在当前窗口显示为单独的页面,可以防止自己的网页作为框架页面被别人调用。设置为:_blank、_top、_self、_parent。1 4、META标签的set-cookie表示cookie设置。如果网页过期,保存的 cookie 将被删除。需要注意的是还必须使用GMT时间格式 并且可以查询页面上的链接。1 3、META标签的代表页面在当前窗口显示为单独的页面,可以防止自己的网页作为框架页面被别人调用。设置为:_blank、_top、_self、_parent。1 4、META标签的set-cookie表示cookie设置。如果网页过期,保存的 cookie 将被删除。需要注意的是还必须使用GMT时间格式 并且可以查询页面上的链接。1 3、META标签的代表页面在当前窗口显示为单独的页面,可以防止自己的网页作为框架页面被别人调用。设置为:_blank、_top、_self、_parent。1 4、META标签的set-cookie表示cookie设置。如果网页过期,保存的 cookie 将被删除。需要注意的是还必须使用GMT时间格式