flash网页抓取工具(flash网页抓取工具一、功能说明(flash)网页)

优采云 发布时间: 2022-03-25 02:01

  flash网页抓取工具(flash网页抓取工具一、功能说明(flash)网页)

  flash网页抓取工具一、功能说明flash网页抓取工具功能:实现用户通过浏览器与flash网页之间的相互互动,抓取,

  1.抓取页面数据:用户感兴趣的。2.保存为flash文件,等待下载。

  现在大家都在争论网页抓取是否需要服务端的支持,不是光靠抓几个url就能抓取来的。要通过adsafe、蜘蛛池抓数据是快一些,但是抓数据需要反爬虫,对服务端要求比较高,本身的网页抓取算法基本就有上千种,服务端的技术实现复杂些,还有很多抓取的坑。

  也就是因为你们说的,flash抓取需要flashsocket,所以那个特定厂商的flashsocket抓取非常慢。就跟下载都是一步一步的传文件一样。

  这样看来有python开发的flash抓取了

  要求很多没php不行没urllib2不行没webdriver不行不同浏览器有区别需要服务端支持才行

  想复用一个网页的数据,还不需要传文件,webdriver基本不可能支持,貌似只有php才能做到,

  你提到的问题主要有两个:1.js执行效率慢2.url对于url对于flash,google做了大量的优化,比如safari只使用通过url接口直接访问:body,(通过找到的),只要tag清晰明确,性能就不会低。如果要抓取一个页面需要数十万url,性能就会极大地降低(因为url对flash的open特性有要求),因此url对于web不够友好。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线