网页采集器的自动识别算法,如何识别出自己网站上有别人的广告?
优采云 发布时间: 2022-06-21 20:02网页采集器的自动识别算法,如何识别出自己网站上有别人的广告?
网页采集器的自动识别算法,这个根据adsense来制定的,它能检测出你这个网页是否存在第三方的广告,毕竟网页广告个人认为很难识别,除非做了标记,哪怕是一个点击还是跳转或进入了第三方广告,adsense也能识别出来,这个技术要求比较高。其实你可以试试meta上传分析的方法,我正在用,不过有点复杂。
说明程序已经做了识别。在进一步解析你的网页源码(程序里叫images),找到其中可能包含的广告类型。最后用一个js库进行disabledivads,去除你的广告logo。
据我所知,adsense自动识别算法是:1是否有广告,2是否为插件,3是否存在第三方广告等等。
这个问题不如问问搜索引擎如何识别
已经识别,还需要一个数据库完成识别,google的目标已经很清楚了。adsense让大家注册的目的就是为了准备让大家把adsense广告识别器安装在自己网站的,目前的解决方案是定义完整的数据库,其他广告识别器的数据库是和adsense相同的,是完全分析的。
问题应该是想问,有哪些机制能识别出自己网站上有别人的广告?这些机制是搜索引擎需要注意的,因为每个广告识别器对每个网站识别出来的都是不一样的,
请自行googleadsensetoolbox。