网页抓取 加密html(web编程,思考着辛辛苦苦换行编写的web别人右键查看源码不就一目了然了?)
优采云 发布时间: 2021-12-31 21:15网页抓取 加密html(web编程,思考着辛辛苦苦换行编写的web别人右键查看源码不就一目了然了?)
有时候网页编程,想着勤劳的网页别人,右键查看源码,是不是一目了然?当然,也有人会写脚本到外部js中导入,不过只是增加了查看源码的步骤。我只是想对整个页面html进行加密,但是当我右键单击它时,我看不到代码。可行吗?使用哪种方法?
一是动态生成html代码,而不是直接输出。只需要js document.write,动态插入html神器!
那么下一步就是考虑编码问题了。也可以直接 document.write("....");但这与不加密没有什么不同。但是我还是用这个方法先测试了一下,遇到了点麻烦。 Web 编程经常会遇到多个双引号引起的字符串错误。为了避免这个双引号问题,必须用编码绕过。
目前比较流行的编码有几种,比如json、base64.,那就先试试json吧。
json 编码运行如下:
右键查看源码,可以看到代码至少按照我的思路运行正常,没有出现双引号问题的错误。中文是json编码的,但是大部分的html代码还是可以看到的。加密效果为1%。
接下来尝试 base64
base64 编码运行如下:
右键查看代码,可以看到html全部加密了,但是还是可以根据数据长度和换行符看到html结构。这仍然是一个单线电话。
下面改为链式调用
代码根本看不到原来的结构了。哈哈
接下来尝试使用二进制编码:
接下来尝试以八进制编码:
接下来尝试使用十进制编码(顺便添加了一些无用的符号以增强混淆):
接下来尝试使用十六进制编码(无分隔符):
接下来尝试使用十六进制编码(带分隔符):
接下来要做一个密码输入框,输入正确的密码就可以显示了。
思路是php端加密真实网页des,http传输,网络传输只是一个大的变量字符串
必须用des解密,密码才知道。这种des加密的优点是可以加密并通过网络传输数据。 http虽然是透明的,但是可以对内容进行加密来锁定数据。别人看到的是一堆乱码的html,不知道实际数据。 des虽然比较弱,但是破解没那么简单
浏览器访问网页时,先输入密码,解密,成功显示真实网页。
其实还有其他编码和其他压缩编码,我不是很清楚,需要动态输出html。我用的php需要搭配js。一方加密,另一方解密。它不匹配或没有合适的编码。做不到。
结论:这种加密纯粹是我自己无聊的研究,但是web服务器输出的html有一层加密。客户端收到后,js动态解码输出。虽然无法通过右键查看代码,但浏览器开发者工具会显示运行以下html代码一目了然。适合不想被爬虫看到的网站。爬虫爬取的数据都是加密乱码的,除非有爬虫模仿浏览器可以跑js。这个加密的网站爬虫估计很不友好。因为爬虫无法识别,不知道你的网站标题和图片链接的内容,但是经过对突变编码的一些研究,对网页有了更深入的了解和理解。
结束。
欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果。