老Y文章管理系统如何在采集的同时自动完成伪原创
优采云 发布时间: 2021-05-23 03:27对于垃圾站的网站管理员来说,最有希望的事情是网站可以自动采集,自动完成伪原创,然后自动收钱。这是世界上最幸福的事情,哈哈。不会讨论自动采集和自动收款。今天,我将介绍如何简单,方便地使用旧的文章管理系统。尽管该功能不如DEDE之类的功能强大,但它几乎是异常的(当然,旧的Y 文章管理系统是用asp语言编写的,似乎不具有可比性),但是有很*敏*感*词*它们非常简单,因此也受到许多网站管理员的欢迎。仍然很少讨论在旧的文章管理系统采集中自动完成伪原创的特定方法。在旧的论坛上,有些人甚至在推销这种方法。我鄙视一下。关于采集,我不会说太多。我相信每个人都可以应付。我要介绍的是旧的Y 文章管理系统如何自动完成采集和采集的工作。利用文章管理系统的过滤功能,实现同义词的自动替换,从而达到伪原创的目的。例如,我想将采集 文章中的所有单词“ wangzhuan博客”替换为“ wangzhuan日记”。详细步骤如下:第一步是进入后台。找到“ 采集管理”-“过滤器管理”,然后添加一个新的过滤器项。我可以创建一个名为“ Wangzhuan Blog”的项目,具体设置请参见图片:“过滤器名称”:填写“ Wangzhuan Blog”,或随意编写,但为方便查看,建议并替换为单词是一致的。
“主题”:请根据您的网站选择网站列(必须选择一列,否则无法保存过滤器项)“过滤器对象”:选项为“标题过滤器”和“文本”过滤器”,通常选择“文本过滤器”,如果要连伪原创标题,也可以选择“标题过滤器”。“过滤器类型”:可用选项为“简单替换”和“高级过滤器”,通常选择“简单替换”,如果选择“高级过滤器”,则需要指定“开始标签”和“结束标签”,以便在代码级替换采集内容。“使用状态”:选项为“启用”和“禁用”,无须说明“使用范围”:选项为“公共”和“私有”选择“私有”,过滤器仅对当前网站列有效;选择“公共”,对所有列均有效,无论采集的任何列中的任何内容为何,过滤器均有效。通常选择“私有”。 “代替”:填写“ Wangzhuan Diary”,只要采集中收录文章中的“ Wangzhuan Blog”一词,它将自动替换为“ Wangzhuan Diary”。在第二步中,重复第一步的工作,直到添加了所有同义词。一些网友想问:我有超过30,000个同义词,我应该手动逐个添加它们吗?什么时候会添加! ?不能批量添加吗?好问题!手动添加确实是几乎不可能完成的任务,除非您有非凡的毅力,否则您可以手动添加这些超过30,000个同义词。
不幸的是,旧的文章管理系统未提供批量导入功能。但是,作为真实,有经验和周到的优采云,我们必须具有优采云的意识。您知道,我们刚刚输入的内容存储在数据库中,而旧的Y 文章管理系统是由asp + Access编写的。 mdb数据库可以轻松编辑!从那时起,我可以通过直接修改数据库来批量导入伪原创替换规则!改进的第二步:修改数据库并批量导入规则。搜索之后,我发现该数据库位于“您的管理目录\ cai \ Database”下。使用Access打开此数据库,然后找到“过滤器”表。您会发现我们刚刚添加的替换规则存储在这里。根据您的需要分批添加!下一个工作涉及Access的操作,所以我不会罗word,您可以自己做。说明“过滤器”表中几个字段的含义:FilterID:自动生成,不需要输入。 ItemID:列ID是我们手动输入时“项目”的内容,但这是数字ID,请注意对应于列的采集 ID,如果您不知道该ID,可以重复第一步并测试FilterName:即“过滤器名称”。 FilterObjece:“过滤器对象”,在“标题过滤器”中填写1,在“文本过滤器”中填写2。
FilterType:“过滤器类型”,为“简单替换”填写1,为“高级过滤器”填写2。 FilterContent:“内容”。 FisString:“开始标记”,仅在设置了“高级过滤器”时有效,如果设置了“简单过滤器”,请将其留空。 FioString:“结束标记”,仅在设置“高级过滤器”时有效,如果设置了“简单过滤器”,请将其留空。 FilterRep:即“替换”。标志:即“正在使用状态”,TRUE为“启用”,FALSE为“禁用”。 PublicTf:“使用范围”。 TRUE表示“公开”,FALSE表示“私有”。最后,让我谈谈使用过滤功能来实现伪原创的经验:文章管理系统的此功能可以自动实现采集 伪原创,但是该功能还不够强大。例如,我的网站上有三列:“第一列”,“第二列”和“第三列”。我希望标题和文本的“第1列”都为伪原创,仅文本的“第2列”就为伪原创,标题的“第3列”都为伪原创。因此,我只能进行以下设置(假设我有30,000个同义词规则):为“第1列”的标题伪原创创建30,000个替换规则;为“第1列” 伪原创的主体创建30,000条替换规则;为“第2列”的文本伪原创创建30,000条替换规则;为“第3列”的标题伪原创创建30,000条替换规则。
这造成了巨大的数据库浪费。如果我的站点有数十列,并且每列的要求都不同,则该数据库的大小将非常令人恐惧。因此,建议在旧版Y 文章管理系统的下一版本中改进此功能:首先,添加批处理导入功能,毕竟存在修改数据库的一定风险。其次,过滤器规则不再附加到某个网站列,而是将过滤器规则分开,并且在创建新的采集项目时,添加有关是否使用过滤器规则的判断。相信此修改可以大大节省数据库存储空间,并且逻辑结构将变得更加清晰。