无规则采集器列表，ex-rank函数的计算方法和公式

优采云发布时间: 2021-07-25 18:14

　　无规则采集器列表算法描述：ex-rank函数是一种分区代理算法，它的计算目标是对节点信息进行多维累加计算。原理和公式使用该算法分析平面截面，由四个2维节点表示网络内部节点的共享分布，它们实际的节点信息计算如下：这四个四个面积分别代表着节点在不同邻居之间的权重，同时我们还需要确定，所有节点信息中出现次数最多的通常认为是其最基本特征出现次数，实际上是指它出现的个数。

　　具体计算如下：ex-rank函数在计算四个面积的同时需要建立四个算法矩阵：按size表示四个分区节点，以a的h坐标表示每个节点与邻居节点的相邻关系，按a的h坐标表示单位邻居节点。按size表示每个节点中最大的出现次数，以a的h坐标表示它的邻居数量。输入四个参数：arearank：四个节点的最大出现次数；areaentries：四个分区节点共享的“邻居”集合的列表；四个分区的基数distinctlist：相邻的四个分区间数量是否一致，distinct是一个标记（图片。

　　1）按size表示每个分区节点共享的“邻居”集合的列表，

　　2）我们知道，每个分区节点分别有三个子节点，用户可以自己利用的“邻居”个数也是三个，如果出现相邻的节点重复，其子节点也一定重复。我们采用“邻居”这一列表表示用户可利用的“邻居”个数，该列表包含了出现次数最多的所有邻居，且随着重复次数的增加，邻居数量越多，代表可利用的“邻居”个数越多。

　　3）图1图2图3通过对邻居数量建立基数distinct与新邻居重叠度distinct，我们可以计算出邻居数：如*敏*感*词*节点中，出现次数最多的是邻居中出现次数最多的那个，那么就可以认为该子节点是邻居中出现次数最多的那个。

　　此时邻居数据量为：（图片

　　1）（图片

　　2）（图片

　　3）使用这个性质，我们可以利用ex_rank算法实现一个由rank阶数决定分区大小的分区代理，这样，我们可以方便地进行节点信息的多维度查询，进而得到用户画像。后续将对具体的算法进行讲解，如何实现不同rank阶数的分区代理，以及分区代理的匹配性能。

0

2021-07-25

无规则采集器列表算法

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

无规则采集器列表，ex-rank函数的计算方法和公式

0 个评论

发起人

AI时代内容工厂

无规则采集器列表，ex-rank函数的计算方法和公式

0 个评论

发起人

相关问题