网页抓取 加密html(非程序级加密索关于网页代码级的加密方法(一))
优采云 发布时间: 2021-10-12 02:02网页抓取 加密html(非程序级加密索关于网页代码级的加密方法(一))
注意:本文讨论的是网页代码层面的加密方式,而非程序层面的加密。
关于网页加密,一般使用unescape函数,简单的将一些特定的符号、中文、字符转换成特定的代码。对于英文,基本上就是原文。加密效果对比如下:
原创代码:
<html>
<头>
</头>
<身体>
<b>好的</b>
</身体>
</html>
加密代码:
<剧本>
<!--
document.write(unescape("%3Chtml%3E%0D%0A%20%20%3Chead%3E%0D%0A%20%20%3C/head%3E%0D%0A%20%20%3Cbody%3E% 0D%0A%20%20%20%20%3Cb%3Eok%3C/b%3E%0D%0A%20%20%3C/body%3E%0D%0A%3C/html%3E"));
//-->
</脚本>
需要指出的是,这类在线加密一般同时也提供解密功能。因此,这种类型的加密是没有意义的,只会增加网页的大小。
再介绍一种加密方式:JSCRIPT.ENCODE & VBSCRIPT.ENCODE(注意:需要浏览器使用IE5及以上)
它可以将JS或VBS或ASP代码编译成完整的乱码字符串。修改任何一个字符都会直接导致整个代码不可用。它的安全性和确保代码的完整性是以前的方法无法比拟的。加密效果对比如下:
原创代码:
警报(“你好”)
加密代码:
<脚本语言=jscript.encode>==^#~@</script>
没有原创代码的痕迹。
要使用这种加密方法,您首先需要从 Microsoft网站 下载 SCRENC 脚本编码器。请注意,它是在 DOS 提示符下使用的命令,但安装后,界面下会有相关的非常详细的图形帮助文件。
以下是程序的语法说明:
描述
加密脚本源代码,使其不易被用户查看或修改。
语法
SCRENC [/s] [/f] [/xl] [/l defLanguage] [/e defExtension] inputfile outputfile
脚本加密程序语法的组成部分如下:
部分说明
/s 可选。开关,它指定脚本加密程序的工作状态是静态的,即不产生屏幕输出。如果省略,默认是提供冗余输出。
/f 可选。指定输入文件将被输出文件覆盖。请注意,此选项将破坏您的原创输入源代码。如果省略,输出文件将不会被覆盖。
/xl 可选。指定不将 @language 指令添加到 .ASP 文件的顶部。如果省略,@language 指令将添加到所有 .ASP 文件中。
/l defLanguage 可选。指定加密过程中使用的默认脚本语言(JScript? 或 VBScript)。如果加密文件中的脚本块不收录语言属性,则认为它是用指定语言编写的。如果省略,则 JScript 是 HTML 页面和脚本小程序的默认语言,而 VBScript 是动态网页的默认语言。对于普通文本文件,默认脚本语言由文件扩展名(.js 或 .vbs)决定。
/e defExtension 是可选的。将输入文件与特定文件类型相关联。当输入文件的扩展名不能清楚地显示文件的类型时,即当输入文件的扩展名不是可识别的扩展名,但文件的内容可以归类为可识别的类型时,使用此开关。此选项没有默认值。如果遇到扩展名无法识别的文件且未指定此选项,脚本加密程序将无法处理无法识别的文件。可识别的文件扩展名是 asa、asp、cdx、htm、html、js、sct 和 vbs。
输入文件是必需的。要加密的文件的名称,包括与当前目录相关的任何必需的路径信息。
需要输出文件。要生成的输出文件的名称,包括与当前目录相关的任何必需的路径信息。