国外网页视频抓取工具(基于python的request进行一个爬虫 )
优采云 发布时间: 2021-11-11 19:08国外网页视频抓取工具(基于python的request进行一个爬虫
)
你知道,我查看了源代码。它似乎是一个基于python请求的爬虫。原理很简单,贡献者很多。
它的介绍和详细的源代码可以在github上找到
普通用户可以使用python的pip3 install you-get,记得经常检查更新。
这里有一个从b站下载视频的教程
首先是汉字的问题,你下载的可能是因为你借用了命令行或者windows powershell
因此,在命令行中会出现中文乱码。解决与否无关紧要,但我会在这里提供一个简短而永久的解决方案。
第一个:作用于当前命令行
可以看到chcp命令,可以修改当前命令行的编码。header 属性中的原创编码是不可接受的。所以我们改成utf-8代码65001
第二个:对未来命令行的统一效果:
使用注册表
输入 win+r-->regedit-->Computer\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Command Processor
添加字段,保存并退出
完成you-get安装后,在命令行输入you-get查看常用命令
根据你的需要使用它,但我们长期使用的下载超长电视剧的方法是使用--playlist参数。一般情况下,如果您下载的系列名称不是很长,您可以正常下载。但是,总有一些例外,这个然后powershell就派上用场了!Powershell是windows平台下提供的一款产品,希望与linux shell并驾齐驱。它自然提供了良好的编程功能。首先打开powershell,然后执行以下命令,从1开始到25结束,步长为+,在1的循环中,使用you-get命令在b站下载一个序号递增的播放列表,然后输出到后面的less_$i文件夹,成功解决问题。
C:\WINDOWS\system32> for($i=1;$i -le 25;$i++)
{
you-get https://www.bilibili.com/video/av95051759?p=$i -o I:\吴恩达团队Tensorflow2.0实践系列课程\lesson_$i
}