vba抓取网页数据(源代码抓取京东小米8手机的配置信息有64行 )

优采云 发布时间: 2022-04-10 02:31

  vba抓取网页数据(源代码抓取京东小米8手机的配置信息有64行

)

  以下代码是用python抓取京东小米8手机的配置信息

  首先找到小米8产品的链接:​​​​

  然后找到它的配置信息的标签,我们找到它的配置信息的标签为

  

  然后分析其配置信息页面的规则,我们发现dl收录dt和dd,一个dt对应一个dd,dt对应一个参数,dd对应参数的具体值

  p>

  

  以下是源码

  import requests<br />from bs4 import BeautifulSoup<br />from pandas import Series<br />from pandas import DataFrame<br /><br /><br />response=requests.get("https://item.jd.com/7437788.html")<br />html=response.text<br /><br />soup=BeautifulSoup(html,"html.parser")<br />divSoup=soup.find("div",attrs={"class","Ptable"}) ##找到其配置信息的标签<br /><br />data=DataFrame(columns=["参数","值"]) #定义一个二元的DataFrame<br />dls=divSoup.find_all("dl")<br /><br />for dl in dls:<br /> dts=dl.find_all("dt")<br /> dds=dl.find_all("dd")<br /> if len(dts)==len(dds):<br /> for i in range(len(dts)):<br /> f=dts[i].getText();<br /> p=dds[i].getText();<br /> data=data.append(Series([f,p],index=["参数","值"]),ignore_index=True);<br />print(data)

  这是捕获的最终配置信息。一共64行,这里就不一一列举了

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线