网页表格抓取(《表》返回数据帧的使用方法分享)
优采云 发布时间: 2021-10-07 13:10网页表格抓取(《表》返回数据帧的使用方法分享)
正如furas所说,您需要提取正确的表格标记(因此请接受他的解决方案)。但我也想补充,考虑使用
方法,因为它为您完成了解析表标签的繁重工作(并在引擎盖下使用了漂亮的汤)。
所以
将返回数据帧列表。我相信你想要的数据框是
, 这是第二个表(在索引位置1):
import pandas as pd
df = pd.read_html('https://www.macrotrends.net/stocks/charts/TSLA/tesla/revenue')[1]
输出:
print(df)
Tesla Quarterly Revenue(Millions of US $) Tesla Quarterly Revenue(Millions of US $).1
0 2020-12-31 $10,744
1 2020-09-30 $8,771
2 2020-06-30 $6,036
3 2020-03-31 $5,985
4 2019-12-31 $7,384
5 2019-09-30 $6,303
6 2019-06-30 $6,350
7 2019-03-31 $4,541
8 2018-12-31 $7,226
9 2018-09-30 $6,824
10 2018-06-30 $4,002
11 2018-03-31 $3,409
12 2017-12-31 $3,288
13 2017-09-30 $2,985
14 2017-06-30 $2,790
15 2017-03-31 $2,696
16 2016-12-31 $2,285
17 2016-09-30 $2,298
18 2016-06-30 $1,270
19 2016-03-31 $1,147
20 2015-12-31 $1,214
21 2015-09-30 $937
22 2015-06-30 $955
23 2015-03-31 $940
24 2014-12-31 $957
25 2014-09-30 $852
26 2014-06-30 $769
27 2014-03-31 $621
28 2013-12-31 $615
29 2013-09-30 $431
30 2013-06-30 $405
31 2013-03-31 $562
32 2012-12-31 $306
33 2012-09-30 $50
34 2012-06-30 $27
35 2012-03-31 $30
36 2011-12-31 $39
37 2011-09-30 $58
38 2011-06-30 $58
39 2011-03-31 $49
40 2010-12-31 $36
41 2010-09-30 $31
42 2010-06-30 $28
43 2010-03-31 $21
44 2009-12-31 NaN
45 2009-09-30 $46
46 2009-06-30 $27
47 2008-12-31
NaN
CN
正如furas所说,您需要提取正确的表格标记(因此请接受他的解决方案)。但我还想补充一点,考虑如何使用它,因为它为您完成了解析表标签的繁重工作(并且在引擎盖下使用了漂亮的汤)。因此将返回数据帧列表。我相信你想要的数据框是,这是第二个表(在索引位置 1): import panda...