网页采集器的自动识别算法,如何识别出自己网站上有别人的广告?

优采云 发布时间: 2022-06-21 20:02

  网页采集器的自动识别算法,如何识别出自己网站上有别人的广告?

  网页采集器的自动识别算法,这个根据adsense来制定的,它能检测出你这个网页是否存在第三方的广告,毕竟网页广告个人认为很难识别,除非做了标记,哪怕是一个点击还是跳转或进入了第三方广告,adsense也能识别出来,这个技术要求比较高。其实你可以试试meta上传分析的方法,我正在用,不过有点复杂。

  说明程序已经做了识别。在进一步解析你的网页源码(程序里叫images),找到其中可能包含的广告类型。最后用一个js库进行disabledivads,去除你的广告logo。

  据我所知,adsense自动识别算法是:1是否有广告,2是否为插件,3是否存在第三方广告等等。

  这个问题不如问问搜索引擎如何识别

  已经识别,还需要一个数据库完成识别,google的目标已经很清楚了。adsense让大家注册的目的就是为了准备让大家把adsense广告识别器安装在自己网站的,目前的解决方案是定义完整的数据库,其他广告识别器的数据库是和adsense相同的,是完全分析的。

  问题应该是想问,有哪些机制能识别出自己网站上有别人的广告?这些机制是搜索引擎需要注意的,因为每个广告识别器对每个网站识别出来的都是不一样的,

  请自行googleadsensetoolbox。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线