php抓取网页表格信息(Python+GoogleAppEngine免费解决方案的存取接口补充说明(一))

优采云 发布时间: 2021-11-10 19:18

  php抓取网页表格信息(Python+GoogleAppEngine免费解决方案的存取接口补充说明(一))

   鼠标悬停在红框上阅读评论,可以了解我的需求,以下是补充说明,有时间可以阅读。

  主要用途:抓取某个租房信息网页的数据,交给我的网站使用(先存入数据库,然后作为网页发布,以后保存数据

  [color=#000000]制作谷歌地图)。你要做的就是第一步,即抓取信息并存入数据库,提供方便的访问接口。当然,如果你提供一种巧妙的方式,定期将数据发布到我的特定网页网站,或者将其导入到google融合表中,那么我将省略后两个特殊步骤。为了表示鼓励,它会在任务量之外。报酬。) 虽然任务不紧急,15天内可以完成,但是如果你觉得还可以,申请一个测试账号,那么最好当天就安装运行成功。我不希望你经常改变这个那个,浪费双方宝贵的时间,所以请仔细阅读文档以准确实现我的意图。[/颜色]

  [color=#333399]提供的平台环境和语言(请本地获取库和代码,然后找我要账号):[/color]

  选项1:PHP + MySQL + Cron 我有一个空闲的虚拟PHP主机(但不是我将发布信息的主机网站。这就是为什么我需要一个数据访问接口。我希望接口足够简单任何支持HTML/Javascript的网页都可以用Key随便调用)。宿主机已经支持 Cron 定时任务,但是你需要安装你准备使用的库。

  方案二:Python+Google AppEngine免费方案,需要安装BeautifulSoup+Mechanize等库,注意采用灵活的方法避开GAE政策限制,哈哈。

  [color=#333399] 选项3:也许有WP高手可以用Wordpress+Autoblog来解决?在PHP主机上也可以,但不知道采集会不会顺利,请仔细阅读任务说明,赐教。[/颜色]

  我讨厌代码太多,所以请务必使用现有的免费和开源库来巧妙地解决问题。代码量不超过250,行为漂亮,哈哈。您的时间应该主要花在分析着陆页的数据结构和集成各种库上。一个几百块钱的任务,几个小时就能完成,你我双赢。如果你的计划太复杂,工作量太大,肯定会让双方尴尬。但是我耽搁了,最后还是违约了。虽然钱没有丢,但时间和事情都耽误了。因为退款了,没办法投诉。半年多没敢来竹八界发任务了)。

  [color=#ff0000]具体任务说明请下载附件查看[/color]。虽然可以多点N次,但是可以防止原来的网站从google上查出谁在得到他的数据——甚至根据他对这个网站的描述,除了一些自己的信息,还有很多其他的也从主要 网站 爬取。[color=#ff0000] 提交任务时请打包,不要在描述中提及原站点,谢谢。任务代号FreeShark[/color] 你可以用这个代号来调用它。

  参考(只是为了让你更清楚我的意图,不是教程,这些你应该早就熟悉了):

  [size=2]Python采集网站数据[/size]

  [尺寸=3][/尺寸]

  其他:([color=#ff0000]这个例子使用代理来逃避跟踪。这是一个聪明的方法来放弃[/color]。)

  ——煽动的好处是可以让你更清楚我的意图,减少在QQ上浪费生命。哈哈,介绍完毕。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线