什么建站系统支持文章采集(高手来说没什么用的三种方法能防住初级采集的目的)
优采云 发布时间: 2022-03-12 20:14什么建站系统支持文章采集(高手来说没什么用的三种方法能防住初级采集的目的)
今天的采集系统不止一个nb,站长采集制作的网站内容总是很快出现在另一个网站上,一个网站很容易被抄袭。有没有办法在不影响搜索引擎正常收入的情况下,解决网站成为采集的痛苦?答案是肯定的。
最常见的防止采集的方法:
1.每个文章的命名不应该有任何规则。比如你的文章是.htm,请在之前或者之后生成一个日期,比如:2.htm,前面是日期,对采集新手非常有效。
2.不要把所有的文章放在一个目录下,可以用日期生成不同的目录名。
3.不要一个模板全部用文章,模板尽量多,添加文章的时候可以选择用哪个模板,一般是采集的采集 程序是目标。他会在 采集 之前分析您的页面。如果你所有的页面布局都是不规则的,那我想他会放弃的。
以上三种方法可以防止初学者采集,但是对于高手来说是没用的。
以下三种方法使用限制采集人的ip或会话的方法来达到防止采集的目的。
方法一:(asp代码):
第二种方法(asp):
第三种方法:
使用持久化给静态页面添加会话功能
一般来说,只有服务器端cgi程序(asp、php、jsp)才有session会话功能,用于保存用户在网站期间(session)的活动数据信息,而对于大量的静态页面的(html)比如只能使用客户端的cookies来保存临时的activity数据,但是cookies的操作是一个非常繁琐的过程,远没有session的操作那么简单。为此,本文向读者推荐一个dhtml中的解决方案“持久化技术”,让session功能也可以在静态页面中使用。
Microsoft Internet Explorer 5 及以后的版本都支持使用状态持久化技术,它允许我们在当前会话期间将一些数据对象保存到客户端,减少对服务器的访问请求,充分发挥客户端计算机的能力。数据处理能力也提高了整体的页面显示效率。
持久化技术有以下可以调用的行为:
savefavorite——页面添加到采集夹时保存页面状态和信息
savehistory——在当前会话中保存页面状态和信息
savesnapshot - 当页面保存到磁盘时保存页面状态和信息
userdata——以 xml 格式保存当前会话的页面状态和信息
持久化技术打破了以往使用cookies和sessions的传统,继承了cookies的一些安全策略,同时也增加了存储和管理数据的能力。我们每页有 64kb 的用户数据存储容量,每个站点的总存储上限为 640kb。
持久化技术存储的数据格式符合xml标准,因此可以使用dom技术中的getattribute和setattribute方法来访问数据。
下面是持久化技术的一个典型应用。通过分析持久化存储的数据,静态页*敏*感*词*有验证功能。
实际判断过程如下:
1.共有三个对象:访问者v、导航页a、内容页c
2.访问者v只能通过导航页面a的链接看到内容页面c;
3.如果访问者v通过其他方式(如通过其他网站超链接、直接在ie地址栏输入URL等)访问内容页面c,内容页面c会自动提示版权信息,显示一个空白页面。
具体实施步骤:
· 在“导航页”中添加样式来定义持久化类,并添加存储函数fnsave进行授权。
· 在“导航页面”和区域中定义一个层来标识持久化对象
· 在“导航页”的超链接属性中添加语句调用函数fnsave:
接下来,将验证添加到内容页面。
· 在“内容页”中添加样式定义持久化类,并添加存储函数fnload判断有效性。
· 修改“内容页面”的区域如下:
***以上代码插入的页面必须在同一个文件夹下,否则会出错。
从上面的例子可以看出,通过持久化的使用,普通的静态内容页*敏*感*词*备了session功能,一般的不敏感信息可以通过session保存在客户端。
使用多个带有会话功能的静态页面可以完成许多复杂的任务,例如虚拟购物车、高级搜索引擎等。减少了数据交互量,大大减轻了服务器的负担。