Python开发:国外抖音人工筛选视频合集(二)
优采云 发布时间: 2021-08-23 03:43Python开发:国外抖音人工筛选视频合集(二)
项目语言:Python
开发时长:1个月
为什么开源:上帝欲灭之,必先使其疯狂。
使用的库:
首先是项目展示链接:
脚本处理示例↑
项目第一阶段将人工筛选的视频下载处理成搞笑合集↑
项目二期将特定人才的视频下载处理成搞笑合集↑
二期工程将Q群沙雕图加工成沙雕图合集↑
三期工程更新合集封面图片如何处理↑
自动识别美女项目三期视频,下载处理成*敏*感*词*姐合集(还没开始)↑
然后是项目地址:
/hokaso/douyin2bilibili
各个脚本文件的详细说明:
douyin2bilibili_采集.py:国内抖音达人视频集集(抖音+国家+人)
douyin2bilibili_streamline.py:Doeyin2bilibili_streamline.py:Domestic抖音Manual Screening Video 采集(抖音+中国+Screening)
douyin2bilibili_streamline_oversea.py: Foreign抖音Manual Screening Video 采集 (抖音+国际+Screening)
pure_upload.py:仅通过分发平台上传的脚本
upload.exe&upload_bg.exe:选择分发视频时调用的文件脚本
GBK.ttf:处理封面时使用的字体
youtube_upload.py:基于you-get的YouTube视频转载脚本
我希望做的所有功能的列表:
在已经实现的目标中(除了以上三个):
快手&抖音+国内&国外+个人:
/muyangren907/Kwai_download_script
其中只有快手国际放映没有实施。
接下来是技术细节:
1.视频的爬取:我用@Jack-Cherish的抖音攀虫(Jack-Cherish/python-spider)做下载模块的最早版本。谢谢。原理是根据短视频的分享链接进入对应的PC网页,提取原创视频链接并下载。后来发现国内的token验证不严谨(AppSign/抖音),于是改成模拟手机app发包收json,批量下载视频链接(个人采集),不过这招不同的是国际版的签名算法抖音app是无效的,所以只能用下一个技巧:用fiddler抓手机,解压json文件,分析下载链接(muyangren907/Kwai_download_script)。
2.封面图片处理:一开始我刚通过(同和君Hocassian:我做视频的时候可以打开视频吗?怎么让电脑学会自己做视频!)这个文章在第九条 生成封面图片的方法 后来觉得这样的封面有点单调,所以改了算法。如果检测到的图像尺寸小于20/27,则使用三图模式(具体算法见下图)。至于如何获取这张图片和三张图片,这里使用moviepy.editer库中VideoFileClip类的duration方法,获取列表中前三个视频1/2时间段的视频截图。根据时间码,使用ffmpeg进行截图。 , 然后去掉黑色边框,再合并。
3.视频背景图片处理:首先要有干净的底部模板。在这个图层模板上,我绘制了几个自由填充的区域:Logo、简介、标题、二维码(第一阶段)、头像、昵称。对应每个短视频,生成对应的背景图片,相关技术:PIL
第一期背景图↑。后来因为视频平台会限制含有二维码的视频的电流,所以项目二期改成了下面的模型↓。
详细的图片处理方法请直接参考我的代码
4.图片和视频的拼接,以及单个视频的合并:通过ffmpeg,请参考相关教程:
5.视频分发:如果一一传,估计很累,所以选择火星云分发,基本支持国内所有大型长视频平台。因为找不到网站的api,所以用了selenium,一个基于谷歌Chrome的自动化测试框架,可以模拟大部分手动操作过程。