php 抓取网页 源码(php抓取网页源码和数据库字段。详情见。。)

优采云 发布时间: 2022-04-17 09:25

  php 抓取网页 源码(php抓取网页源码和数据库字段。详情见。。)

  php抓取网页源码和数据库字段。详情见。

  搜索引擎爬虫,如果是做定制搜索引擎,首先要了解常见的http协议,熟悉常见的服务端语言,比如java,php等。

  会php的话,

  做爬虫,就得有爬虫的思想,抓数据来做分析,关键看你分析什么数据,数据来源有什么。这都是做爬虫要思考的。而php是最能熟练做抓取的语言了。

  最底层的是浏览器,对应的技术python和php区别在于python有get,headerurl后端的话,分布式,

  java爬虫,

  一定要考虑后端开发,java好.因为网站的根本是后端数据处理,这个需要写代码(前端可以只写界面,也可以写后端代码).php只是服务器开发.如果是做后端开发,推荐php.如果做web开发,java是首选.做web,java的需求更大.

  理论上都可以,网上有大把的视频资料,最好的是报个班学习,效率高。网上的教程不多,但讲的都差不多。

  之前看过一段话,觉得很有意思:如果你要做数据分析,java和php没有差别,如果你要做数据挖掘,php与java的差别可能比较大,但是如果做爬虫,两者都没有区别了。

  个人感觉java更好一些。

  如果想好做爬虫,那java更适合,反正什么都得做,会点php会比不会好,php除了页面,写的比java来的简单,再说毕竟php是前端不是后端,写爬虫没什么差别,如果你是找工作,单纯想找工作应该就是这样,不知道对不对。如果你想做数据挖掘,php也是比java方便好多,如果想一条道走到黑,还是java的。

  不过两者感觉差不多,java就是做web的,反正想爬取数据大多都是前端这边,只是生活中很多公司都觉得他们是后端开发。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线