直观:抖音采集工具

优采云 发布时间: 2022-10-11 17:43

  直观:抖音采集工具

  您可以采集作者的所有作品(包括作者喜欢的作品)、单个视频作品、特定主题挑战下的指定数量的作品以及使用特定音乐的指定数量的作品。

  主要是为了方便对作品下载的管理,分别保存,同时检测作者作品、话题挑战、音乐的更新,有新作品时才下载新作品。

  对于之前使用过“批处理采集抖音Works”工具的朋友,新版控制台工具可以自动迁移数据,当然也可以继续使用之前的工具。

  我不再重复介绍。下载过本帖旧版工具的人自然会知道如何使用。压缩包中还有获取控制台操作图片和视频的说明和短链接。

  

  已提供最新的Python GUI版本,获取各种作品采集的链接可以在网盘的demo视频中找到。

  新版工具下载地址:,访问密码:52pj

  Lanzous云盘lanzous无法访问(21.5.13),请使用lanzoui访问(本帖链接已更改)

  添加另一个百度网盘地址:,提取码:r7c6 旧版工具下载地址(或原版):,访问密码:3345

  如果64位版本有问题,可以试试32位版本,如果还是不行,可以试试XP版本

  

  XP版的Python版已经提供,Gui版的VB版就不需要了。

  教程:README.md · 二毛/抖音爬虫

  抖音采集简介

  Python取数据+Vue编写接口+Aria2下载

  根据抖音各种链接或各种id,通过网页界面采集视频作品,并将作品下载到本地。

  支持用户主页链接或sec_uid/topic挑战和音乐配乐链接或ID。

  常见问题

  2021.10.09 测试还正常采集用户工作。

  测试环境:Python3.7+pip latest+Win10_x64

  支持下载点赞列表(点赞列表需要可见)。有些用户可以下载点赞列表(点赞列表需要可见),有些用户无法下载(即使点赞列表可见)。是设置问题还是账号注册日期问题(与sec_uid是否带下划线无关),测试账号结果见user.txt。

  安装失败靠百度解决或者更换Python和pip版本;

  UI启动报错是pywebview库调用的浏览器不兼容Vue(win7下默认调用IE,不兼容ES6语法);

  因为本项目下的评论平台不会通知我,我也无法通过扫码回复赞助的消息,所以如果有任何问题,请提交issue,或者加QQ留言,或者反馈,我可以看到并以所有这些方式回复。.

  使用 0x00 安装依赖项

  在程序目录下打开命令行,输入

  pip install -r requirements.txt

  0x01 使用UI界面

  双击打开startup.bat,或者在程序目录下打开命令行,输入

  python ui.py

  0x02 直接修改douyin.py中的相关参数即可使用

  完全不懂Python的朋友使用命令行或者操作界面。

  

  有基础可以查看源码或者查看这个md文件,之前写的内容注释掉

  0x03 直接在命令行使用exec.py查看命令列表,或者使用-h参数查看帮助

  python exec.py

python exec.py -h

python exec.py download -h

python exec.py download_batch -h

  使用函数名调用程序

  --type 指定下载类型,默认值:--type=user

--limit 指定采集数量,默认值:--limit=0(不限制)

  比如采集一个用户的所有作品:

  python exec.py download https://v.douyin.com/xxxx/

python exec.py download 用户的secuid

  例如采集用户喜欢的Top 10作品:

  python exec.py download MS4wLjABAAAAl7TJWjJJrnu11IlllB6Mi5V9VbAsQo1N987guPjctc8 --type=like --limit=10

python exec.py download 用户的secuid

  比如采集某音乐配乐的前10部作品:

  python exec.py download https://v.douyin.com/xxxx/ --type=music --limit=10

python exec.py download 音乐ID --type=music --limit=10

  TODO支持作者扫支付宝红包码,嫖红包,你好我

  

  或者你可以扫描这个

  知识点抖音相关Aria2相关Python相关命令行模块fire相关UI模块pywebview相关笔记

  偶然发现抖音网页的界面恢复了(有数据没有频繁请求),于是想修复之前做的采集工具,但是代码太乱了,我有看的头疼,只好稍微改了下扔了。

  最近比较无聊,打算用Python重写一个版本,所以有了这个介绍。

  我是Python入门级,晚期懒癌。10号开始有了具体的想法。大概花了3天零碎的时间构思程序结构(主要是理解面向对象的思维),看了很多文档。

  我以为自己写个下载函数还不如直接调用Aria2。毕竟功能强大稳定,但是网上Python调用Aria2的例子并不多。翻了个身,强行学习了一波。

  之前没写过课,第一次根据对各种文章文档和网上的理解写出来。现在我觉得,其实不管你写不写类,都可以写一样的函数,而且代码差别不大。但是,功能多的时候,如果不使用类,就会乱七八糟(Easy Language的上一版本是很久没用了,看,自己看就头疼) ,类还有一个优点,就是public属性。

  面向对象编程确实有优势。首先抽象类,然后实例化对象。代码结构一目了然,加上继承,真是厉害。

  12日晚上,我开始敲代码。13号差点写了用户的作品采集和下载功能。然后14号写了题目和音乐下载,同时完成了命令行。考试通过后,我不想动太多。直到今天16号,终于写好介绍了。接口暂时不写,等后天或者后天打包exe。

  可以说这次又学到了很多东西,不过根据以往的经验,估计几天之内就全部忘记了,没办法,就这样吧。

  2021.03.16

  拖了将近3周,终于写好了UI。

  清明节前一天晚上开始工作,结果一夜之间改了几行代码,直到前一天晚上才写东西。然后翻了百度,两三个晚上就写了这个东西。

  而这一次我发现之前不能采集用户点赞,不是界面问题,是因为用户设置了隐藏设置,没办法,而是用户的公开(比如自己) 可以被采集点赞。

  事实上,很长一段时间我都认为 HTML 是一个界面。当时想用精益浏览器来加载页面。后来写了Python,专门找了miniblink库。当时发现了一个比较活跃的更新,但是忘记叫什么了,因为在搜索的过程中发现了pywebview库。感觉很强大,也比较完善,也不需要自带浏览器内核,所以就有了这个尝试。

  界面上只写了基本功能,数量有限的采集就不写了,就一个输入,不过如果觉得难看就不加了。

  不打算再打包exe了,太浪费时间了,而且打包还是很大的。而且Python环境的安装非常简单。百度有一堆教程。

  这个软件到这里就差不多写完了,以后有机会写个快手。

  2021.04.08

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线