java从网页抓取数据(java从网页抓取数据是个好想法,难道不是代码实现么?)
优采云 发布时间: 2021-12-07 13:31java从网页抓取数据(java从网页抓取数据是个好想法,难道不是代码实现么?)
java从网页抓取数据是个好想法,但是如果你要做到网页本身的数据可抓取就不是那么容易了。网页本身的数据抓取,难道不是代码实现么?并且实现起来,算法也非常复杂。除非,你网页已经做好了,你一下子能够把网页上的每个文字都抓取下来,把它分词后重新命名抓取数据。但是这里要考虑的问题,就是抓取程序要和真正的浏览器兼容,并且实现的话还要做网页加密以避免web2.0的各种隐私问题。除非真的可以一步登录对应的网页,现在绝大多数的网站做不到。理论上那就可以抓取了。
个人觉得不可能,目前浏览器都是原生渲染的,本身对于网页内容来说已经足够接近原生情况了,如果他给你爬取网页上的内容,那等于你把网页内容重新实现一遍,那其实无论浏览器做成多好,到了加载页面那一步,你的浏览器就会蒙逼,因为它已经没有办法响应网页上更新的内容了,所以我觉得想实现这个功能不现实。
比一比lol和dota
个人认为有难度
前两年火爆起来的ar技术如果ar做出点儿违和感谁不会觉得奇怪,个人猜想其实也许制造业也想过在消费者脑海中实现购物的场景。举例,如果能同时让消费者觉得门口有一块布在非节假日时空荡荡的存在,而节假日时是热闹非凡,这么想能不觉得哪里有点儿奇怪吗?不能控制流量而靠服务实现网络推广,普通消费者肯定接受不了这个,除非消费者的行为是预设路径的,好像地铁的线路查询,汽车的车牌查询。