抓取动态网页(代码中添加其他作者的不同信息(中英对照))
优采云 发布时间: 2022-01-24 14:10抓取动态网页(代码中添加其他作者的不同信息(中英对照))
我正在网上抓取不同作者在谷歌学术上的出版年数和数量,到目前为止,这是我只有一位作者的代码:我正在网上抓取不同作者在谷歌学术上的出版年数和出版数量,到目前为止这是我只有一位作者的代码:这是我到目前为止只有一位作者的代码:
from selenium import webdriver
mozilla_path = r"C:\Users\ivrav\Python38\geckodriver.exe"
driver = webdriver.Firefox()
driver.get("https://scholar.google.com/citations?user=8Cuk5vYAAAAJ&hl=en")
driver.maximize_window()
years = [element.get_attribute("textContent") for element in driver.find_elements_by_xpath('//span[@class="gsc_g_t"]')]
citations = [element.get_attribute("textContent") for element in driver.find_elements_by_xpath('//span[@class="gsc_g_al"]')]
for year, citation in zip(years, citations):
print(year, citation)
但是,我的疑问取决于如何在同一代码中添加其他作者的不同信息。我应该使用循环吗?我应该使用循环吗?我不太确定如何解决这个问题。举个例子,我要刮的另一个网页只是举个例子,我要刮的另一个网页是
非常感谢,Best,Iván