通过关键词采集文章采集api(来说一说怎么使用高德开放平台查询相关关键词的地址坐标?)

优采云 发布时间: 2022-04-11 18:18

  通过关键词采集文章采集api(来说一说怎么使用高德开放平台查询相关关键词的地址坐标?)

  在上一篇介绍微博开放平台的时候,我们谈到了通过高德开放平台获取地名和地址的坐标。今天我们就来讲讲如何使用高德开放平台查询相关关键词的地址坐标,或者采集学校、医院、餐厅、公园、商家等POI的信息。

  高德开放平台提供接口文档。本文使用搜索界面。通过配置城市、关键词、POI类型等参数,查询符合条件的POI,返回POI的名称、类型、地址、经纬度、电话号码。和其他信息。

  (1)首先根据地名地址关键词搜索匹配的POI,并将地名地址空间化。

  

  使用python内置库urllib.request获取url返回的数据,并使用urllib.parse中的引号对url进行编码,因为url中的关键词是中文则无法识别url .

  

  上图是程序的主要部分。通过搜索关键字,返回相关的 POI 信息,包括坐标。代码也比较简单,读取csv文本文件中的关键词,通过搜索界面查询。返回的内容只能保留第一个结果,否则20个结果全部返回第一页,然后把返回的结果存入一个csv文件。最后运行函数。

  (2)查询某一类型的所有POI信息

  上述程序仅在第一页保存了 20 条数据。如果我想要某个区域内所有的道路、公园或餐馆的名称、地址和坐标,我需要返回所有的查询结果。这里我们使用更简洁的 requests 库而不是内置的 urllib.request 库:

  

  首先定义了两个函数,一个是获取url返回的数据,一个是解析json数据,后面会复用每个页面的数据。

  

  url中有几个参数需要注意,一个是POI的类型,一个是城市代码。这两个参数可以根据接口文档中的“POI分类代码和城市代码表”进行设置;citilimit=true 表示限制为 本次城市搜索,children=1 表示显示子级 POI,offset=20 表示每页 20 个条目,最多 25 个条目,key 需要使用自己的 key。参数和返回值还是要看接口文档。

  作为个人开发者,程序不宜跑得太快,接口调用有限,每日搜索限额为1000次。有 400,000 个面向企业开发人员的应用程序。

  最后感谢微博和高德以开放共享的心态发布了一些数据,供数据爱好者使用。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线