抓取动态网页(Excel教程Excel函数Excel表格制作Excel2010Excel实用技巧Excel视频教程)

优采云发布时间: 2022-02-07 00:08

　　我想抓取一个网页：

　　我需要所有商店名称、电话号码及其地址的数据

　　但我最多只能做10个

　　导致加载需要滚动页面的其他项目

　　我的代码：

　　import requests

import bs4

crawl_url = requests.get('https://www.justdial.com/Mumbai/Dairy-Product-

Retailers-in-Thane/nct-10152687', headers={'User-Agent': 'Mozilla/5.0'})

crawl_url.raise_for_status()

soup = bs4.BeautifulSoup(crawl_url.text, 'lxml')

for elems in soup.find_all('span', class_="jcn"):

select_a = elems.select('a')

for links in select_a:

href = links.get('href')

res = requests.get(href, headers={'User-Agent': 'Mozilla/5.0'})

xsoup = bs4.BeautifulSoup(res.text, 'lxml')

Name = xsoup.select('.fn')

tel = xsoup.select('.tel')

add = xsoup.select('.adrstxtr')

a = Name[0]

b = tel[0]

c = add[0]

print(a.getText())

print("--"*10)

print(b.getText())

print("--"*10)

print(c.getText())

print("=="*25)

　　当我们向下滚动页面时会加载其他项目

　　所以我想知道如何获得尽可能多的数据/项目

　　我试过

　　但是没有悄悄理解好，我也没有得到那个POST方法：/

　　如果您需要更多信息，请与我们联系

　　最佳答案

　　tmadam 给出的解决方案有效

　　这是代码

　　import requests

import bs4

def spider(max_pages):

page = 1

while page < max_pages:

url = "https://www.justdial.com/Mumbai/Dairy-Product-Retailers-in-

Thane/nct-10152687/page-%s" % page

crawl_url = requests.get(url, headers={'User-Agent': 'Mozilla/5.0'})

crawl_url.raise_for_status()

soup = bs4.BeautifulSoup(crawl_url.text, 'lxml')

for elems in soup.find_all('span', class_="jcn"):

select_a = elems.select('a')

for links in select_a:

href = links.get('href')

res = requests.get(href, headers={'User-Agent':

'Mozilla/5.0'})

xsoup = bs4.BeautifulSoup(res.text, 'lxml')

Name = xsoup.select('.fn')

tel = xsoup.select('.tel')

add = xsoup.select('.adrstxtr')

a = Name[0]

b = tel[0]

c = add[0]

print(a.getText())

print("--"*10)

print(b.getText())

print("--"*10)

print(c.getText())

print("=="*25)

page += 1

spider(3)

　　关于 python - Beautifulsoup - 抓取网页 - 动态加载页面，我们在 Stack Overflow 上发现了一个类似的问题：

0

2022-02-07

抓取动态网页

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

抓取动态网页(Excel教程Excel函数Excel表格制作Excel2010Excel实用技巧Excel视频教程)

0 个评论

发起人

AI时代内容工厂

抓取动态网页(Excel教程Excel函数Excel表格制作Excel2010Excel实用技巧Excel视频教程)

0 个评论

发起人

相关问题