php curl抓取网页内容(phpcurl抓取网页内容很简单,但是如果要抓取qq登录参数)
优采云 发布时间: 2022-03-29 13:06php curl抓取网页内容(phpcurl抓取网页内容很简单,但是如果要抓取qq登录参数)
phpcurl抓取网页内容很简单,但是如果要抓取qq登录参数,必须用到phptesseract,因为tesseract需要你的浏览器支持php,phptesseract和phpurllib、curl、curlopt等库相似,使用起来很方便,可以直接接收图片地址,可以截取网页最上面几行,也可以截取网页中的所有图片。
请看下面的代码#!/usr/bin/envphpfromtesseractimport*fromphpinfoimportphpinfofromioimportiofromthreadingimportthreaddefget_url():"""获取网页内容"""#从浏览器上抓取网页的urlurl=""forlineinurl:#分析网页表达式寻找到一个图片,下面是一些在配置前的代码:img_name=line.strip('')[2].split('\x70')[0]#使用以.jpg开头的json格式,将图片地址存储在一个json字符串中json_content=json.loads(img_name)if__name__=='__main__':url='='+phpinfo()#这里必须满足io、phpinfo、tesseract={'content_description':'你的登录信息','entity':[{'name':'zhihu','version':123,'sid':'0','accept':'application/json,text/javascript,*/*;q=0.01','accept-language':'zh-cn,zh;q=0.01','accept-encoding':'gzip,deflate','accept-language':'zh-cn,zh;q=0.01','host':'','secondary-host':'...','user-agent':'mozilla/5.0(windowsnt6.1;wow64)applewebkit/537.36(khtml,likegecko)chrome/41.0.1216.73safari/537.36'}],'cookie':[{'filename':'zhihu.jpg','filekey':'zhihu_ref.jpg','class':'jpg_camera','location':''}]}]s=set(tolist(url))img_data={'time':s['content_description'],'headers':[{'accept':'application/json,text/javascript,*/*;q=0.01','accept-language':'zh-cn,zh;q=0.01','accept-encoding':'gzip,deflate','accept-language':'zh-cn,zh;q=0.01','type':'image/jpg'}]}res=get_url(url)img_data['src']=res['data']+'.jpg'img_data['。