直观:网页采集器的自动识别算法可能会有更新的?

优采云 发布时间: 2022-10-04 06:06

  直观:网页采集器的自动识别算法可能会有更新的?

  网页采集器的自动识别算法可能会有更新的,也可能是服务商造成的。这两个方式最好还是用js分析一下,

  同求,目前采集数据的软件,速度慢,稳定性差,有没有什么好的方法去改善,目前用过网页分析,爬虫,可视化等。真不知道该怎么选了。

  

  采集是不可能采集的了,因为我不知道有种东西叫做模板对话框采集器。

  我刚才写了一个采集网页的框架,效果挺不错,

  把问题改为采集本地信息,应该会快点,实现前端抓取可以百度flashfilter或者handmadejs.

  

  采集服务器有可能的,我们之前写过一个基于c#的采集工具,名叫xxpro。不过作者写这个框架是为了开发flash插件,而flash插件,得写很多代码,设置正则表达式,给需要通过指定框架实现业务逻辑的人才用的到。

  这个方向找到好多了。例如直接从浏览器获取localstorage或html5标签下的值?再或者可能是servlet框架封装的比较好,浏览器一次响应页面,就能读取到数据库中,看得见看不见,直接硬链接过去还是网站特地封装的方式?不太清楚后者的可行性。说实话,写程序真的很难。而且思考这个问题,就是初学,容易走偏。

  如果不走偏,又只是想写个小程序,没有什么深度,写着写着就会写习惯了,如果已经有html,css和js,php,ruby,python等等。基本可以把这个换方向,可以从把业务拆开写,然后多重继承和封装。或者另开一门语言,从零开始写,由点到面。我在vue和angular这两个框架中犹豫了很久。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线