(js,html)获取当前页面所有元素对象的观点
优采云 发布时间: 2021-04-21 03:04(js,html)获取当前页面所有元素对象的观点
自动采集工具,我觉得楼主可以先尝试下今天,我的同事,也是一名攻城狮,在看着一个页面的时候,出现了框架,发送请求后报404,然后一查,是服务器本身存在问题。想测试下,可以上服务器看看,发现问题在于浏览器端我想说的是,技术上,我也不知道能不能解决这个问题,但是这个页面每次都是404,这个是比较烦的。个人见解,不喜勿喷。
不同意各位在程序里封装对应字段的观点。我想这么做是为了以后封装出来的工具能帮助你建立一种统一的规范。如同mvc的封装。自动采集本质上和刷题基本一样。都是从日志切入去抓数据,并且留下本地日志(做记录),然后后续处理。我觉得这不是改前端样式这么简单,需要考虑程序集成,web和h5双向传递数据,才能做出来。
方法很多的,通过domist(js,html)获取当前页面所有元素对象,利用各种方法,
可以用tagxedo,一个将html标签class字段化的工具,比如你所要抓取的就是要抓取页面里的网页标签,可以将上述字段设置好,例如要将一个标签下的所有html都作为重点抓取的内容,比如class属性是‘g’字段是‘出现',数量'等,之后还可以抓包分析出网页所有的url地址等信息,可以用作新闻抓取和社交抓取等。