php抓取网页数据插入数据库(php抓取网页数据插入数据库php最好不要用)

优采云 发布时间: 2021-10-19 02:01

  php抓取网页数据插入数据库(php抓取网页数据插入数据库php最好不要用)

  php抓取网页数据插入数据库php最好不要用第三方库,看了里面的一些官方教程,基本上都不能用。针对你网站上的爬虫页面采集的数据存在php缓存中,那么可以试着给缓存设置的间隔规则设置一个默认值,还有就是不设置缓存时间,进程最多进入10个header而不是100多个也不好。看看这个吧抓取网页数据+-1、插入数据库一般的使用第三方库库php-curl-s;但是这个库,你需要测试抓到的数据有没有连接池,如果有,那么进程就是有连接池的,也就可以被允许。

  如果第三方库库php-curl-s这个你看不上,那么可以考虑php-session-listen-async,这个库是基于session,然后读取的时候,只有session中读取的数据才是正确数据。本来2亿/条记录有400万个并发的写入的,但是你这里竟然只有150万个并发。所以,看你能不能接受。2、试试抓500万条。

  (这个数据来源于我的个人爬虫)其实这个数据也很简单,可以用一个axios来实现一个简单的http服务,用api读取第三方库库php-curl-s。我用最简单的,直接模拟8080端口抓取的数据。我抓取的网站的名字叫光哥资料:,500万条连接池+cookie+post注册的数据。我认为,这是可以可接受的数据量。第三方库库php-curl-s。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线