抓取网页音频(网易云加入live推荐功能让用户不用录制音频来推荐音乐)
优采云 发布时间: 2022-01-04 00:01抓取网页音频(网易云加入live推荐功能让用户不用录制音频来推荐音乐)
抓取网页音频以外还有很多思路,加入live推荐功能可以让用户不用录制音频来推荐音乐,比如网易云就开放了live接口,但是不要期望有用户来提交自己的音乐来推荐音乐。更简单粗暴的做法是直接生成dom并直接post到服务器,记得放缓存。
如果要判断是否已经到达时间戳的尾巴部分,可以使用http_executablefilename.get("http_filename.get")或者http_headerfilename.get("http_filename.get")。如果要判断是否还是在"www./"之类,可以使用brpc,参见:-io/brpc。
可以尝试:打开看看,如果一直显示那个页面,那就确定不是在上传文件,如果页面可以打开,用这个方法,可以判断是否在爬取。
我觉得你可以先找一下原始css,确认了这个部分的确是在下载,然后你只需要在需要下载的页面里面加上一行(;preload=true),就能判断是否在下载css了。
这个用selenium的时候,可以自己写个判断方法,比如判断部分段落是否是弹出框,然后利用js判断,但这对于分辨率比较小的网页就比较麻烦,
采用ajax请求+form/field
定位的方法有三种:1.通过beautifulsoup来定位2.定位位置就用爬虫代理,