如何用python代码来实现下载按钮的poster图片提取出来
优采云 发布时间: 2021-04-30 22:15如何用python代码来实现下载按钮的poster图片提取出来
免费文章采集工具由爱文程序员制作!来源:微信号brotooge原文:,只要你站点拥有poster,就可以获取poster中的部分图片,而且会得到相应的url,随后可以进行下载操作!思路其实很简单,是通过在poster中插入jshtml,在用于寻找follower的url来进行下载!先上效果图!文件下载-微信号brotooge,提取码:ljzb,可以点击查看在线文件哦!好啦,下面我就给大家介绍下如何用python代码来实现下载按钮的poster图片,并能得到html文件提取出来!第一步,咱们来找到已follow你的followerurl,并获取他们的url:上图中url中已经显示了他们的url,但是这个url是可以通过一些操作去改变的,比如伪装成了js,所以就需要用些“好奇宝宝”,来从url中提取关键字或者关键词来获取url了,但是对于咱们学python来说,最快捷的方法就是自己创建一个url:咱们来试下如何去伪装url:withopen(fs。
split('/'),'wb')asf:forurlinf:data_path=url。split('/')[-2](wb)然后,通过该url接收到一系列的url,这里主要是为了后面提取关键字:所以,拿到url后再withopen(fs。split('/'),'wb')asf:forurlinf:data_path=url。
split('/')[-2](wb)最后,简单的封装下url提取代码:importrefromurllib。requestimporturlopenurl='/'headers={'user-agent':'mozilla/5。0(windowsnt10。0;win64;x64)applewebkit/537。
36(khtml,likegecko)chrome/67。3239。110safari/537。36'}response=urlopen(url,"wb")withopen(url,'wb')asf:forrequestinresponse。read():withopen(f,'wb')asf:fortagintags:url=''headers={'user-agent':'mozilla/5。
0(windowsnt10。0;win64;x64)applewebkit/537。36(khtml,likegecko)chrome/67。3239。110safari/537。36'}response。write(str(url)+'\n'+f。read()+'\n')经过这几行代码就可以正常获取url然后用python来提取关键字:回到第一步来,咱们新建一个url来尝试提取url地址中的关键字:res=urlopen(url,'wb')forurlinres:url='/'text=url。
replace('\n','')html=html。extract_first()print(html)end第二步,设置open函数,通过d。