无规则采集器列表,ex-rank函数的计算方法和公式

优采云 发布时间: 2021-07-25 18:14

  无规则采集器列表,ex-rank函数的计算方法和公式

  无规则采集器列表算法描述:ex-rank函数是一种分区代理算法,它的计算目标是对节点信息进行多维累加计算。原理和公式使用该算法分析平面截面,由四个2维节点表示网络内部节点的共享分布,它们实际的节点信息计算如下:这四个四个面积分别代表着节点在不同邻居之间的权重,同时我们还需要确定,所有节点信息中出现次数最多的通常认为是其最基本特征出现次数,实际上是指它出现的个数。

  具体计算如下:ex-rank函数在计算四个面积的同时需要建立四个算法矩阵:按size表示四个分区节点,以a的h坐标表示每个节点与邻居节点的相邻关系,按a的h坐标表示单位邻居节点。按size表示每个节点中最大的出现次数,以a的h坐标表示它的邻居数量。输入四个参数:arearank:四个节点的最大出现次数;areaentries:四个分区节点共享的“邻居”集合的列表;四个分区的基数distinctlist:相邻的四个分区间数量是否一致,distinct是一个标记(图片。

  1)按size表示每个分区节点共享的“邻居”集合的列表,

  2)我们知道,每个分区节点分别有三个子节点,用户可以自己利用的“邻居”个数也是三个,如果出现相邻的节点重复,其子节点也一定重复。我们采用“邻居”这一列表表示用户可利用的“邻居”个数,该列表包含了出现次数最多的所有邻居,且随着重复次数的增加,邻居数量越多,代表可利用的“邻居”个数越多。

  3)图1图2图3通过对邻居数量建立基数distinct与新邻居重叠度distinct,我们可以计算出邻居数:如*敏*感*词*节点中,出现次数最多的是邻居中出现次数最多的那个,那么就可以认为该子节点是邻居中出现次数最多的那个。

  此时邻居数据量为:(图片

  1)(图片

  2)(图片

  3)使用这个性质,我们可以利用ex_rank算法实现一个由rank阶数决定分区大小的分区代理,这样,我们可以方便地进行节点信息的多维度查询,进而得到用户画像。后续将对具体的算法进行讲解,如何实现不同rank阶数的分区代理,以及分区代理的匹配性能。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线