python抓取网页数据( 智联招聘上一线及新一线城市所有与BIM相关的工作信息)

优采云 发布时间: 2021-10-13 12:31

  python抓取网页数据(

智联招聘上一线及新一线城市所有与BIM相关的工作信息)

  

  Python简单的网络爬虫获取网页数据

  以下是获取智联招聘一线及新一线城市所有BIM相关职位信息,进行一些数据分析。

  1、 先通过chrome在智联招聘上搜索BIM职位信息,跳出页面后ctrl+u查看网页源码,如果没有找到当前页面的职位信息。然后快捷键F12打开开发者工具窗口,刷新页面,通过关键字过滤文件,找到收录位置的数据包。

  

  

  2、查看这个文件的请求URL,分析其结构,发现数据包的请求URL为

  ‘https://fe-api.zhaopin.com/c/i/sou?’+请求参数组成,那么根据格式构造了一个新的url(

‘https://fe-api.zhaopin.com/c/i/sou?pageSize=60&cityId=763&workExperience=-1&education=-1&companyType=-1&employmentType=-1&jobWelfareTag=-1&kw=造价员&kt=3’)

  复制到浏览器进行访问测试,成功获取相应数据

  3、 获取的数据为json格式。首先对数据进行格式化,分析结构,确定代码中数据的分析方法。

  

  4、 明确请求 URL 和数据结构后,剩下的就是在代码中实现 URL 构建、数据分析和导出。最终得到了1215条数据,需要对数据进行进一步排序进行数据分析。

  

  推荐:【MYSQL课程】

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线