免规则采集器列表算法((2009)S1—0134~O3基于关联规则的贝叶斯网络分类器张子义)
优采云 发布时间: 2021-10-28 16:21免规则采集器列表算法((2009)S1—0134~O3基于关联规则的贝叶斯网络分类器张子义)
6DShandong255409,中国) 摘要:基于分类的关联(CBA)算法建立了一个基于关联规则的分类器,没有考虑分类问题中的不确定性。提出了一种基于贝叶斯网络分类器的石油关联规则。改进算法用候选边缘初始化图结构,通过Apfiofial算法提取,并通过贪婪搜索获得比树·增强网络(TAN)分类器更好的网络结构。对 15 个 UCI 数据集的实证研究表明,改进后的算法产生了更高的准确度 shtna TAN, CBA。关键词:基于分类的协会(CBA);贝叶斯网络分类器;structurelearning 0 简介 1 贝叶斯网络分类器关联规则挖掘是数据挖掘中最重要的算法之一。这种计算贝叶斯网络将属性变量之间的关系表达为可以与之配合使用的有向图的流行,很大程度上源于Apriori...算法的发展及其对变量联合概率分布的方便计算。用候选边缘初始化图结构,通过Apfiofialgorithm提取,并通过贪婪搜索获得比树·增强网络(TAN)分类器更好的网络结构。对 15 个 UCI 数据集的实证研究表明,改进后的算法产生了更高的准确度 shtna TAN, CBA。关键词:基于分类的协会(CBA);贝叶斯网络分类器;structurelearning 0 介绍 1 贝叶斯网络分类器关联规则挖掘是数据挖掘中最重要的算法之一。贝叶斯网络将属性变量之间的关系表示为可以与之配合使用的有向图的流行,很大程度上源于Apriori...算法的发展及其对变量联合概率分布的方便计算。用候选边缘初始化图结构,通过Apfiofialgorithm提取,并通过贪婪搜索获得比树·增强网络(TAN)分类器更好的网络结构。对 15 个 UCI 数据集的实证研究表明,改进后的算法产生了更高的准确度 shtna TAN, CBA。关键词:基于分类的协会(CBA);贝叶斯网络分类器;structurelearning 0 简介 1 贝叶斯网络分类器关联规则挖掘是数据挖掘中最重要的算法之一。
通常,我们将其称为改进。文献[2]使用关联规则算法提取那些只与分类相关的:B={G,0},其中G表示网络结构,0表示参数相关规则(ClassAssociationRule,CAR)网络结构。放。根据分解定理,有:()=-n_T(XilPa(五))。规则的分类器(ClassificationBasedon Association,CBA)。虽然实证结果表明CBA可以取得比c4.5更好的性能,设置观测数据D和样本的类标签C建立最优贝叶斯网络结构,但CBA没有考虑分类问题中的不确定性,为此我们结合贝叶斯使分类器的分类性能尽可能高尽可能使用贝叶斯 定理,我们使用贝叶斯网络(BN)来表征这种不确定性。未知 BN 样本被分类到具有最大后验概率的类别中。贝叶斯网络分类器是一个有向图模型,可以表达属性之间的概率关系。朴素学习主要包括:结构G的学习和参数0的学习。贝叶斯结构假设属性在类条件下是条件独立的,由于其1.1结构的学习简单性和良好的分类性能使其得到广泛应用。但是,实际的结构学习主要分为生产学习和判别学习。贝叶斯网络分类器是一个有向图模型,可以表达属性之间的概率关系。朴素学习主要包括:结构G的学习和参数0的学习。贝叶斯结构假设属性在类条件下是条件独立的,由于其1.1结构的学习简单性和良好的分类性能使其得到广泛应用。但是,实际的结构学习主要分为生产学习和判别学习。贝叶斯网络分类器是一个有向图模型,可以表达属性之间的概率关系。朴素学习主要包括:结构G的学习和参数0的学习。贝叶斯结构假设属性在类条件下是条件独立的,由于其1.1结构的学习简单性和良好的分类性能使其得到广泛应用。但是,实际的结构学习主要分为生产学习和判别学习。由于其 1.1 结构的学习简单性和良好的分类性能使其得到广泛应用。然而,实际的结构学习主要分为生产学习和判别学习。由于其 1.1 结构的学习简单性和良好的分类性能使其得到广泛应用。然而,实际的结构学习主要分为生产学习和判别学习。
在问题中,属性往往是相互依存的,所以我们需要学习一个更具生成性的学习算法。目标是找到一个复杂的贝叶斯网络结构,使其似然函数最大化,从而达到更好的分类性能。学习贝叶斯网络结构,典型例子是在类变量C的条件下最大化属性网络结构。最通用的方法是求值+搜索方法,它定义了条件互信息:一个求值函数来搜索网络拓扑。具体来说,首先,给定 ZZ(BlD)=M ∑ lpday(set; Pa(X,)/cIC)+Co (I) 一个初始结构和评估函数,一种 Where (Xi)/C# 其中 cn 是一个常数学期。判别学习常常优化判别的目标函数:一种新的结构。由此产生的结构称为增量结构。例如,树增量简单性,如条件似然函数和分类错误率。其中,条件似然函数与贝叶斯结构(Tree-AumgentedNaiveBayesina,TAN)等直接相关。M 本文提出了一种新的贝叶斯网络分类算法,首先使用了相关性分类,定义为:CLL(BID):5∑logPB(cl)。自联合规则算法提取网络结构的候选边集,然后使用贪婪爬虫经常使用贪婪搜索来获得局部最优结构。山搜索以获得更好的拓扑。1.2参数学习在15个UCI数据集上的实验结果表明了算法的有效性。
虽然网络参数学习也有判别式学习,但一般没有封闭形式的解决方案。由于计算时间复杂度高,一般只有接受稿件日期:2008-08-03;修订日期:2008-10-07。作者简介:章子怡(1977一),男,lh Dongqingdao,讲师,硕士,主要研究领域:网络安全、数字媒体、网络数据挖掘;王德良(1979一),男,山东泰安)人,讲师,硕士,主要研究方向:智能系统,数据挖掘。六月章子怡等:基于关联规则的贝叶斯网络分类器个数的生产学习解决参数的最大似然估计。首先使用 Diriehlet for alllitern.setX ∈L.setdo 检验来平滑最大似然:
节点与y之间的互信息定义为: 未来网络结构的学习。文献[2]只使用关联规则进行分类,这些确定性规则没有充分考虑分类问题的不确定性,而P.y)=)log guess(3)贝叶斯网络可以充分描述这种不确定性。因此,希望通过关系和项目出现频率来定义规则R:{., ,...,}联合规则来指导贝叶斯网络结构的建立。1的评价分数为:2.I关联规则挖掘 s() = ∑ num(, z,..., Y}) × 假设数据集 D 的所有属性都是离散属性,我们可以将每个字符串(属性编号、属性值)视为一个项( Item).在项目集中,c44)被称为-Y是一个规则,其中,l,是如果项目z的出现频率表示为nU'/Z/(z),那么我们可以用nttm(z)来表示项目z的出现频率。Rule——l,支持度表示为(hum(X)/lDI)×100%,2.5学习贝叶斯网络的结构可靠性定义为(/,/~tm(X)/num(XUY)) ×100%。因此, , 关联规则 我们已经从项目集中提取了候选边。下面是一个贪心挖掘问题,可以分解为两部分:1)找到所有大于支持度的算法来最大化似然函数(即所有边的互信息之和):项目集支持度最小;2) 由 item set-y 规则生成。那么我们可以用nttm(z)来表示物品z出现的频率。Rule——l,支持度表示为(hum(X)/lDI)×100%,2.5学习贝叶斯网络的结构可靠性定义为(/,/~tm(X)/num(XUY)) ×100%。因此, , 关联规则 我们已经从项目集中提取了候选边。下面是一个贪心挖掘问题,可以分解为两部分:1)找到所有大于支持度的算法来最大化似然函数(即所有边的互信息之和):项目集支持度最小;2) 由 item set-y 规则生成。那么我们可以用nttm(z)来表示物品z出现的频率。Rule——l,支持度表示为(hum(X)/lDI)×100%,2.5学习贝叶斯网络的结构可靠性定义为(/,/~tm(X)/num(XUY)) ×100%。因此, , 关联规则 我们已经从项目集中提取了候选边。下面是一个贪心挖掘问题,可以分解为两部分:1)找到所有大于支持度的算法来最大化似然函数(即所有边的互信息之和):项目集支持度最小;2) 由 item set-y 规则生成。/~tm(X)/num(XUY))×100%。因此, , 关联规则 我们已经从项目集中提取了候选边。下面是一个贪心挖掘问题,可以分解为两部分:1)找到所有大于支持度的算法来最大化似然函数(即所有边的互信息之和):项目集支持度最小;2) 由 item set-y 规则生成。/~tm(X)/num(XUY))×100%。因此, , 关联规则 我们已经从项目集中提取了候选边。下面是一个贪心挖掘问题,可以分解为两部分:1)找到所有大于支持度的算法来最大化似然函数(即所有边的互信息之和):项目集支持度最小;2) 由 item set-y 规则生成。
如果或yI收录endfr类属性,那么我们称之为与分类相关的关联规则对于图1中的三个关联规则,{X,,}-C属于(ClassificationFocusedAssociationRule)。图1显示了分类LSc,{c}一个属于L,{c}一个属于。相关关联规则 例如,{location,,}-C, {C}-also, {Ct- 都是面向分类的关联规则。
3 实验结果验证本文算法(记为BNCAR)的有效性,我们将其与常用分类器进行比较:朴素贝叶斯分类器(NB)、贝叶斯网络分类器(TAN)、基于关联规则的分类(CBA) 15 个 UCI 数据集。一些数据集收录连续值。我们将它们离散为离散值。此外,我们消除了属性收录缺失值的样本。表 1 列出了所有 UCI 数据集的信息。2.3 挖掘与分类相关的关联规则对于所有数据集,我们运行10个交叉验证步骤,每次使用Apfiofi算法提取与分类相关的关联规则:第一次交叉验证将数据集分成10份,问最后取其精度的平均值为10。该算法生成一个长度不超过K的项目集,然后用分类提取连续运行的平均值,以消除样本划分的随机性。我们基于著名的关闭规则。C++机器学习库Torch实现NB、TAN、BNCAR计算 Ll={1arge1-item—sets}fork: 2; ≤K 且L l≠ ⑦;k++do方法,而CBA使用作者提供的可执行程序得到了答案。对于一个S = apriori-gen(一个1)BNCAR算法,我们凭经验给出以下参数:minsup=0.01;ofrallitemX∈,dominco=0.01;项目集的最大大小为K=3。C++机器学习库Torch实现NB、TAN、BNCAR计算 Ll={1arge1-item—sets}fork: 2; ≤K 且L l≠ ⑦;k++do方法,而CBA使用作者提供的可执行程序得到了答案。对于一个S = apriori-gen(一个1)BNCAR算法,我们凭经验给出以下参数:minsup=0.01;ofrallitemX∈,dominco=0.01;项目集的最大大小为K=3。C++机器学习库Torch实现NB、TAN、BNCAR计算 Ll={1arge1-item—sets}fork: 2; ≤K 且L l≠ ⑦;k++do方法,而CBA使用作者提供的可执行程序得到了答案。对于一个S = apriori-gen(一个1)BNCAR算法,我们凭经验给出以下参数:minsup=0.01;ofrallitemX∈,dominco=0.01;项目集的最大大小为K=3。
FRIEDMANN、GEIGERD、GOLDSZMIDTM。由于贝叶斯网络仅使用规则生成分类规则,未考虑分类分类器[J]. Machine1w_~-'ning, 1997, 29 (2/3): 131-163. 问题中的不确定性。
本文提出了一种基于关联规则的贝叶斯[4] PERNKOPFF, BILMESJ。Discriminativeversusgenerativeparam·网络分类算法。与经典的贝叶斯网络分类器TAN相比,我们的贝叶斯网络分类器的eterand结构学习[C] // Pro-使用关联规则挖掘算法提取初始候选边,使用第22届机器学习国际会议的贪心算法eeedings . 得到更好的贝叶斯网络结构。纽约:ACM 在 15 个标准 UCI 数据集上。2005 年:657-664。实验结果表明,我们的算法BNCAR 可以得到优于TAN 和CBA [5] BLAKEC、MERZC。UCIrepositoryofmachinelearningdatabases 高分类性能。最后,如何构建更好的关联规则评价标准是E[B/OL]。[2008-O6-15]。 集成电路。里。edu/mleam/ 还有待解决的问题。机器学习库。htm1。(上接第130页) 2) 在车间作业计划管理中,车与车间之间的*敏*感*词*交接和非关键*敏*感*词*提出了不同的进料计划和采购计划。
上述思考时间内的周转次数,应保证车间在加工过程中的连续性。在该表指导下开发的计算机辅助物料管理系统在运行中取得了表2 MRP净需求计划的结果,特别是在重要部位的物料进料策略的制定上,具有一定的指导意义,采购计划的制定,保证以相对较小的成本满足生产需要,整体上合理控制库存水平。参考文献: [1] 周玉清,刘博英,周强.ERP理论、方法与实践[M].北京:电子工业出版社,2006年2月 []胡政国,李海燕,陈炳森.基于价值流的物料管理策略研究[J].机械工业自动化,生产计划与控制[M].北京:中国科学技术出版社,2005。 [4] 王树明,夏国平。基于时间坐标产品结构在物料管理中的应用[J]. 系统工程理论与方法的应用, 2001, 1(1O): 23-26. [5] 瓦格纳姆,WH1TINTM。Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171. 生产计划与控制[M].北京:中国科学技术出版社,2005。 [4] 王树明,夏国平。基于时间坐标产品结构在物料管理中的应用[J]. 系统工程理论与方法的应用, 2001, 1(1O): 23-26. [5] 瓦格纳姆,WH1TINTM。Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171. 夏国平。基于时间坐标产品结构在物料管理中的应用[J]. 系统工程理论与方法的应用, 2001, 1(1O): 23-26. [5] 瓦格纳姆,WH1TINTM。Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171. 夏国平。基于时间坐标产品结构在物料管理中的应用[J]. 系统工程理论与方法的应用, 2001, 1(1O): 23-26. [5] 瓦格纳姆,WH1TINTM。Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171. Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171. Dynamicversionofhteeconomiclot 注:每期总成本为1015.sizemodel[J]. 管理科学, 2004, 50(11): 1770—1774. 4 结论 6 [] KOHSCL, SADSM. MRP—受不确定性干扰的受控制造环境 [J]. Roboticsnad Computer Integrated 分析毛坯料加工和采购特性原材料针对相关问题. 重型制造, 2003, 19 (1/2): 157—171.