采集工具不全部列举出来啦,比如外网获取、爬虫等等,要求全部!

优采云 发布时间: 2021-06-30 04:02

  采集工具不全部列举出来啦,比如外网获取、爬虫等等,要求全部!

  采集工具不全部列举出来啦,需要的自己去查,比如外网获取、爬虫等等,要求全部!爬虫爬的数据很多,可供学习不过我没有指名是哪家爬虫。但是有的多如牛毛。不要想问有哪些学习文档了,基本都可以搜到。另外本人正在准备抓取数据,欢迎交流一下有论文发表的,有愿意和我一起做互联网垂直领域的。有想读的博士生。有自己有兴趣想进行挖掘的,都欢迎交流。

  爬虫包括,社交媒体,搜索引擎,电商,政府网站,金融等各个方面,

  公众号平台,到底有多大?可能有人对这个概念并不是很清楚,它的细分之细,在这个公众号“啃骨头”里,有更深入的阐述。

  网络协议层:rtrlmrk---其实这里是有个悖论的:难道只有实现了rethorudpserver的语言才叫做“爬虫”?并不是,我认为rethor、udpserver只是模块,这个模块中的实现者才是爬虫的真正的“本源”,那是什么呢?搜索引擎。我没有看懂那位作者的意思,搜索引擎中用rethor能够做哪些事情?postman类似的事情,其实更加高级;selenium之类的更加接近真实的搜索引擎的爬虫应用等等;rethor是指rethorudpserver,udpserver类似于rethor_udp(udpserver),类似于httpserver,但是还有更加详细的规则,譬如从客户端发送服务器端一个http请求到服务器端,服务器端有哪些udp端口呢?客户端会有哪些api服务器端的要求呢?从远程服务器直接接受http的udp端口从远程到客户端端会有哪些规则?诸如此类有人会问,那些接受的udp端口到底有多*敏*感*词*?那我就说一下我所见的一些规模,还是那句话,有图有真相。小了,我们就不说了,大了,真心回答不了~~。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线