网页表格抓取(《表》返回数据帧的使用方法分享)

优采云 发布时间: 2021-10-07 13:10

  网页表格抓取(《表》返回数据帧的使用方法分享)

  正如furas所说,您需要提取正确的表格标记(因此请接受他的解决方案)。但我也想补充,考虑使用

  方法,因为它为您完成了解析表标签的繁重工作(并在引擎盖下使用了漂亮的汤)。

  所以

  将返回数据帧列表。我相信你想要的数据框是

  , 这是第二个表(在索引位置1):

  import pandas as pd

df = pd.read_html('https://www.macrotrends.net/stocks/charts/TSLA/tesla/revenue')[1]

  输出:

  print(df)

Tesla Quarterly Revenue(Millions of US $) Tesla Quarterly Revenue(Millions of US $).1

0 2020-12-31 $10,744

1 2020-09-30 $8,771

2 2020-06-30 $6,036

3 2020-03-31 $5,985

4 2019-12-31 $7,384

5 2019-09-30 $6,303

6 2019-06-30 $6,350

7 2019-03-31 $4,541

8 2018-12-31 $7,226

9 2018-09-30 $6,824

10 2018-06-30 $4,002

11 2018-03-31 $3,409

12 2017-12-31 $3,288

13 2017-09-30 $2,985

14 2017-06-30 $2,790

15 2017-03-31 $2,696

16 2016-12-31 $2,285

17 2016-09-30 $2,298

18 2016-06-30 $1,270

19 2016-03-31 $1,147

20 2015-12-31 $1,214

21 2015-09-30 $937

22 2015-06-30 $955

23 2015-03-31 $940

24 2014-12-31 $957

25 2014-09-30 $852

26 2014-06-30 $769

27 2014-03-31 $621

28 2013-12-31 $615

29 2013-09-30 $431

30 2013-06-30 $405

31 2013-03-31 $562

32 2012-12-31 $306

33 2012-09-30 $50

34 2012-06-30 $27

35 2012-03-31 $30

36 2011-12-31 $39

37 2011-09-30 $58

38 2011-06-30 $58

39 2011-03-31 $49

40 2010-12-31 $36

41 2010-09-30 $31

42 2010-06-30 $28

43 2010-03-31 $21

44 2009-12-31 NaN

45 2009-09-30 $46

46 2009-06-30 $27

47 2008-12-31

NaN

  CN

  正如furas所说,您需要提取正确的表格标记(因此请接受他的解决方案)。但我还想补充一点,考虑如何使用它,因为它为您完成了解析表标签的繁重工作(并且在引擎盖下使用了漂亮的汤)。因此将返回数据帧列表。我相信你想要的数据框是,这是第二个表(在索引位置 1): import panda...

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线