网页视频抓取脚本(STM32视频段的加密手段(一) )
优采云 发布时间: 2022-02-13 07:10网页视频抓取脚本(STM32视频段的加密手段(一)
)
文章内容仅供学习
一:未加密的网页
F12打开开发者工具,对齐视频窗口,vedio标签中的src会有视频资源链接
二:加密网页没有直接资源地址,视频文件被分成n段传输
如上图,链接前有一个blob标记。我们不能直接使用这个资源链接。
但是,我们可以通过开发者工具的“网络”抓包
搜索关键词“ts”(即后缀为ts的视频文件)
这里每个包都是一个视频,n个视频放在一起组成一个视频
通过观察可以发现,这些视频片段的资源链接是有规律的
最后 3 位从 0 递增
然后,你可以把视频拉到最后,查看最后一个视频的地址
发现最后一个视频链接的后三位是430
那么,让我们把这431个ts的视频文件下载下来,然后拼接起来吧~
我在 IDM 的帮助下进行批量下载
使用此脚本完成431视频片段的下载
之后就是视频拼接,我用的软件是:合并工具
合并ts片段后就是一个完整的视频文件
三:blob的一种处理方法
去掉带有blob的视频链接后,网页会自动解析出真实的资源地址
(仅适用于一些 网站s)
第二种处理方法
新建一个a标签,然后在href中填入blob的资源地址:标签,然后点击访问
(记得在a标签中添加内容,否则在网页中是找不到的)
ps:有的网站加密方式比较厉害,这类视频片段的资源链接不规范。我还没有想到下载那种 网站 的方法。
还有一些网站会限制访问,需要正确的key才能有访问资源的权限,否则会报403
还有,一酷一奇艺的视频链接是这样加密的(这不是ts视频片段,而是mp4后缀)
对于同一个资源地址,n个视频段用标识码区分,加上控制访问权限的键值加密
(有些有 start 和 end 我们可以用这个代替下载 - 从视频的开头开始,在视频的结尾结束)
三:通过python包下载(前提是安装了python)
蟒蛇安装
用you-get包下载视频
进入命令行窗口:
1pip install you-get
2
3
1you-get 视频网站
2
3
(链接到网页)
上图为下载BZ的视频
视频默认保存在 C:\Users\username\
也可以指定输出目录
1you-get -o D:/movie 视频网站
2
3