自动采集数据(自动采集数据的程序叫做python爬虫)
优采云 发布时间: 2021-10-21 14:04自动采集数据(自动采集数据的程序叫做python爬虫)
自动采集数据的程序叫做python爬虫。python里面一大堆库,web框架,c/c++,python爬虫自动抓取其实也可以解决“一个或者多个字段列表如何提取关键字”。实在不行,多写几个爬虫,
soupui已经支持
然后你可以开始手工采集了
其实题主想问的是怎么把公式用库写出来这个爬虫啊好难啊(捂脸)
我觉得还是关键是要去利用爬虫从多种来源来获取数据,而且要找到可以满足需求的库。我之前写过bash抓包的代码。
用python自带的python3scrapy应该可以自动抓取
搜索之下有requests或者flask就用这俩,
用pythonscrapy好了爬虫框架里面都支持了。http库postman,http2库zapier,mongodb有mongoose,graphviz有graphviz,buffer库有openmongo,datelite有datelite,redis有redis都可以,
我觉得有两个python对外开放的接口分别对应于图像和字符。比如图像方面的:发图片到qq啊,知乎啊微信啊或者别的方式一般人用不了,可以得到一定信息,但是我觉得比较局限。所以目前网上找不到。但是字符识别或者匹配,可以搜搜:百度啊,必应啊啥的。类似于这样:长qq号点感谢,长微信号识别。题主你会用到的。