抓取网页音频(网易云加入live推荐功能让用户不用录制音频来推荐音乐)

优采云 发布时间: 2022-01-04 00:01

  抓取网页音频(网易云加入live推荐功能让用户不用录制音频来推荐音乐)

  抓取网页音频以外还有很多思路,加入live推荐功能可以让用户不用录制音频来推荐音乐,比如网易云就开放了live接口,但是不要期望有用户来提交自己的音乐来推荐音乐。更简单粗暴的做法是直接生成dom并直接post到服务器,记得放缓存。

  如果要判断是否已经到达时间戳的尾巴部分,可以使用http_executablefilename.get("http_filename.get")或者http_headerfilename.get("http_filename.get")。如果要判断是否还是在"www./"之类,可以使用brpc,参见:-io/brpc。

  可以尝试:打开看看,如果一直显示那个页面,那就确定不是在上传文件,如果页面可以打开,用这个方法,可以判断是否在爬取。

  我觉得你可以先找一下原始css,确认了这个部分的确是在下载,然后你只需要在需要下载的页面里面加上一行(;preload=true),就能判断是否在下载css了。

  这个用selenium的时候,可以自己写个判断方法,比如判断部分段落是否是弹出框,然后利用js判断,但这对于分辨率比较小的网页就比较麻烦,

  采用ajax请求+form/field

  定位的方法有三种:1.通过beautifulsoup来定位2.定位位置就用爬虫代理,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线