网页抓取解密(爬取大众点评之网页内容加密意思是哪里获取到的)
优采云 发布时间: 2021-10-18 00:14网页抓取解密(爬取大众点评之网页内容加密意思是哪里获取到的)
分析网页内容
原创网址:
大家在抓取公众评论时,对文本的个别部分进行了加密,如图:
只显示span标签和class,没有信息。这种信息加密一般是通过css处理的。
我们在review元素中随机点击一个span code,右边出现svgmtsi[class^="rsk"],还有一个背景图片链接如图:
关联:
打开它看看:
看图,好像这里可以找到所有加密的中文字体,那么这个svg链接是从哪里得到的呢?如前所述,这种加密字体是在 CSS 模式下的。我们在网站的源代码中找到它。
打开后可以直接在里面找到上面的svg链接,说明这是正确的css路径。
现在我们打开css链接,如图:
内容大概是 .udyoma{background:-168.0px -166.0px;} 这个模式出现了,我们找一个span类看看这里有没有出现过。
rsk9oe 加密的意思是“我”,并在 css 中找到了位置。rsk9oe{背景:-126.0px -3094.0px;}
这里的背景和上面提到的svg有什么关系?
让我们打开 svg 看看“我”在源代码中的位置,
#77 这里应该在源代码里
相应的。“我”在后面0-9位,试试126/9=14,即126/14=9,测试其他字体,rsk2up代表“一”,css为.rsk2up{background:-29 4.0px -842.0px;},svg里是盗厂丝绒讽刺石碑,覆盖糠秕、天钩、赤琴国、欧柘父、州与李的烦恼,
, 294/14=21,svg中的位置是对应的,说明计算方法没有错,后面的数字是怎么对应的?我们也用上面的.rsk9oe{background:-126.0px -3094.0px;},路径中3117和3094的关系是3117-3094=23,那么用这个23来验证“A”,是否是865,使用842+23=865,确实验证了23的计算是正确的。至此,所有的解密过程基本完成,解密使用什么代码就看个人喜好了。
这里只是简单介绍一下解密的思路,希望对大家有帮助
网页信息不断变化,请根据您当时访问的网页信息进行解码,,,