国家统计局的数据不是要用中国人均工资的
优采云 发布时间: 2022-08-24 12:45国家统计局的数据不是要用中国人均工资的
抓取网页数据违法吗?答案显然是违法的。例如,我们通过爬虫爬取国家统计局的2012年城镇人均工资水平数据,并用python分析挖掘了2017年基尼系数与城镇人均工资的关系。事实上,无论是python还是sql都可以完成以上数据分析任务。事实上,在python爬虫框架中,也有多个会采用sql访问国家统计局数据库。
这就是网页数据爬取采用的sql,它存在一定缺陷。我们从python中访问国家统计局网站时,不能使用pagesize,并且,普通ie,能够正常访问也有速度要求。事实上,最低配置的python程序可以读取0字节的html文件,在c++程序中,python可以使用ifile等直接读取文件。所以,在这种情况下,python程序完全可以完成数据的采集并保存到mysql数据库。
所以在这种情况下,国家统计局网站数据采集,python爬虫框架可以用pysql。所以,如果未来对数据挖掘感兴趣,值得提前学习这部分知识。公众号“小菜鸟数据分析”,回复“数据挖掘”即可获取python数据挖掘开发指南等资料。
肯定是不合法的,会侵犯他人权利,你想像下,你自己用爬虫你还可以去别人的数据库中取数据,这不明摆着就侵犯权利么。国家统计局的数据不是要用中国人均工资的数据了么,可能就不要爬,国家会管的。