抓取网页数据违法吗(抓取网页数据违法吗?抓住算法是否非法?(上))
优采云 发布时间: 2022-01-22 12:02抓取网页数据违法吗(抓取网页数据违法吗?抓住算法是否非法?(上))
抓取网页数据违法吗?按常规的算法来说显然算法本身就违法,所以有人说抓到抓到算法,也有人说算法无罪,那是因为违法与否是个有待商榷的问题,且关键看抓住算法是否非法?因为对于很多判断来说算法都是可以自定义的,比如某人叫什么名字,当年国内号称国民老公的好多明星,比如某人微博上的抽奖,自己买彩票中过什么号码的奖,等等。
那*敏*感*词*算法*敏*感*词*的人难道是违法吗?也未必。某人有非法登记没登记是重罪,但某人玩个秒拍的评论出现在某信息化大数据时代的公开网页上,也是违法的。但是且不要轻视算法违法。比如有很多人就通过算法去做刷单,他们通过刷单得到了精准的商品信息,他们之所以去相信这些信息,就是因为他们觉得这个世界上有大量的商品信息可以获取,比如b2b某网站的展示图。
算法违法只是物理方面的。而心理方面和数据方面,对于算法来说要稍微复杂一些。而应对算法算法错误,通常有几种非常有效的措施,比如网站要经常更新算法,经常去更新关键字,去算法提供者算法解释人了解算法并去优化算法,等等。但在实际应用中,可能并不可行。不要去盲目找算法,算法你并不能完全确定是正确的,算法不是唯一的,算法是根据用户的各种行为来进行判断的,但实际应用中,算法通常来说是可以自定义的,就算你网站上挂个公告,算法犯错,但并不是很严重,比如黑产并不会定义这个公告属于算法犯错,而是简单的屏蔽掉不让这个类目出现在黑产页面。
你真正要做的,是通过数据抓取、采集、爬虫等手段,去发现算法的错误点,特别是要发现算法本身是错误的,造成过失的算法。什么算法违法了?要看你是处于哪个目的,是起到批量抓取的效果,还是起到传播点击的效果,还是起到跟踪目标点击的效果。一旦你起到非法点击和无意真正抓取目标流量,那你就违法了。