网页抓取 加密html(非程序级加密索关于网页代码级的加密方法(一))

优采云 发布时间: 2021-10-12 02:02

  网页抓取 加密html(非程序级加密索关于网页代码级的加密方法(一))

  注意:本文讨论的是网页代码层面的加密方式,而非程序层面的加密。

  关于网页加密,一般使用unescape函数,简单的将一些特定的符号、中文、字符转换成特定的代码。对于英文,基本上就是原文。加密效果对比如下:

  原创代码:

  <html>

  <头>

  </头>

  <身体>

  <b>好的</b>

  </身体>

  </html>

  加密代码:

  <剧本>

  <!--

  document.write(unescape("%3Chtml%3E%0D%0A%20%20%3Chead%3E%0D%0A%20%20%3C/head%3E%0D%0A%20%20%3Cbody%3E% 0D%0A%20%20%20%20%3Cb%3Eok%3C/b%3E%0D%0A%20%20%3C/body%3E%0D%0A%3C/html%3E"));

  //-->

  </脚本>

  需要指出的是,这类在线加密一般同时也提供解密功能。因此,这种类型的加密是没有意义的,只会增加网页的大小。

  再介绍一种加密方式:JSCRIPT.ENCODE & VBSCRIPT.ENCODE(注意:需要浏览器使用IE5及以上)

  它可以将JS或VBS或ASP代码编译成完整的乱码字符串。修改任何一个字符都会直接导致整个代码不可用。它的安全性和确保代码的完整性是以前的方法无法比拟的。加密效果对比如下:

  原创代码:

  警报(“你好”)

  加密代码:

  <脚本语言=jscript.encode>==^#~@</script>

  没有原创代码的痕迹。

  要使用这种加密方法,您首先需要从 Microsoft网站 下载 SCRENC 脚本编码器。请注意,它是在 DOS 提示符下使用的命令,但安装后,界面下会有相关的非常详细的图形帮助文件。

  以下是程序的语法说明:

  描述

  加密脚本源代码,使其不易被用户查看或修改。

  语法

  SCRENC [/s] [/f] [/xl] [/l defLanguage] [/e defExtension] inputfile outputfile

  脚本加密程序语法的组成部分如下:

  部分说明

  /s 可选。开关,它指定脚本加密程序的工作状态是静态的,即不产生屏幕输出。如果省略,默认是提供冗余输出。

  /f 可选。指定输入文件将被输出文件覆盖。请注意,此选项将破坏您的原创输入源代码。如果省略,输出文件将不会被覆盖。

  /xl 可选。指定不将 @language 指令添加到 .ASP 文件的顶部。如果省略,@language 指令将添加到所有 .ASP 文件中。

  /l defLanguage 可选。指定加密过程中使用的默认脚本语言(JScript? 或 VBScript)。如果加密文件中的脚本块不收录语言属性,则认为它是用指定语言编写的。如果省略,则 JScript 是 HTML 页面和脚本小程序的默认语言,而 VBScript 是动态网页的默认语言。对于普通文本文件,默认脚本语言由文件扩展名(.js 或 .vbs)决定。

  /e defExtension 是可选的。将输入文件与特定文件类型相关联。当输入文件的扩展名不能清楚地显示文件的类型时,即当输入文件的扩展名不是可识别的扩展名,但文件的内容可以归类为可识别的类型时,使用此开关。此选项没有默认值。如果遇到扩展名无法识别的文件且未指定此选项,脚本加密程序将无法处理无法识别的文件。可识别的文件扩展名是 asa、asp、cdx、htm、html、js、sct 和 vbs。

  输入文件是必需的。要加密的文件的名称,包括与当前目录相关的任何必需的路径信息。

  需要输出文件。要生成的输出文件的名称,包括与当前目录相关的任何必需的路径信息。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线