原创文章自动采集(如何应用老Y文章管理系统采集时自动完成伪原创的方法)
优采云 发布时间: 2022-03-25 23:09原创文章自动采集(如何应用老Y文章管理系统采集时自动完成伪原创的方法)
作为垃圾站的站长,最有希望的是网站可以自动采集,自动完成伪原创,然后自动收钱。这真是世上最幸福的事了,呵呵。自动采集 和自动收款将不予讨论。今天给大家介绍一下在应用旧的Y文章管理系统采集时如何自动补全伪原创。
旧的Y文章管理系统使用简单方便,虽然功能没有DEDE之类强大到近乎变态的程度(当然旧的Y文章管理系统写的用asp语言,好像没有可比性。),但是都有,而且比较简单,所以也受到很多站长的欢迎。老Y文章管理系统采集时主动完成伪原创的详细方法很少讨论。在老Y的论坛上,甚至有人卖这个方法,所以我有点鄙视。.
至于采集我就不多说了,相信大家都能做到,我要介绍的是旧的Y文章管理系统如何同时自动完成伪原创作为采集的具体工作方法,大体思路是利用老Y文章管理系统的过滤功能实现同义词的自动替换,从而达到伪原创的目的@>。比如我想把采集文章中的“网赚博客”全部换成“网赚日记”。具体步骤如下:
第一步是进入后台。找到“采集管理”-“过滤器管理”,添加一个新的过滤器项。
我可以建立一个名为“净赚博客”的项目,详情请看图:
“过滤器名称”:填写“网赚博客”即可,也可以随便写,但为了方便查看,建议与替换词相同。
“项目”:请根据您的网站选择一个网站列(必须选择一列,否则过滤项目将不保留)。
“过滤对象”:选项有“标题过滤器”和“文本过滤器”。您可以正常选择“文本过滤器”。如果你想伪原创连标题,你可以选择“标题过滤器”。
“过滤器类型”:选项有“简单替换”和“高级过滤”,分别选择“简单替换”,如果选择“高级过滤”,则需要指定“开始标记”和“停止标记”,以便您可以使用 采集 中的内容在代码层面进行替换。
“使用状态”:选项有“启用”和“禁用”,无需说明。
“使用规模”:可用选项为“公共”和“私人”。选择“Private”,过滤器只对当前网站列有效;选择“Public”,对所有列有效,无论采集任一列的任何内容,过滤器都有效。只需选择“私人”。
“内容”:填写“网赚博客”,要替换的词。
“替换”:填写“网赚日记”,这样只有采集的文章中的“网赚博客”字样会自动替换为“网赚日记”。
第二步是重复第一步的工作,直到添加完所有同义词。
有网友想问:我有3万多个同义词,是不是还要手动一个一个添加?什么时候加啊!?不能批量添加吗?
好问题!手动添加是一项不可能完成的任务,除非您有非凡的毅力手动添加这 30,000 多个同义词。遗憾的是,旧的 Y文章 管理系统没有提供批量导入的功能。但是,作为真正的前辈,思考优采云,我们必须有勤奋的人的觉醒。
要知道我们刚才输入的内容是存储在数据库中的,而旧的Y文章管理系统是用asp+Access写的,mdb数据库也可以轻松编辑!所以,我可以直接修改数据库方法来批量导入伪原创替换规则!
改进第二步:批量修改数据库和导入规则。
经过搜索,我发现数据库位于“您的管理目录\cai\Database”下。用Access打开数据库,找到“Filters”表,你会发现我们刚才添加的替换规则都存放在这里,根据你的需要,批量添加!接下来的工作会影响Access的运行,我就不罗嗦了,大家自己动手吧。
解释一下“Filters”表中几个字段的含义:
FilterID:自动生成,无需输入。
ItemID:列ID,也就是我们手动输入时“item item”的内容,但这里是数字ID。注意对应列的采集ID。如果不知道ID,可以重复第一步,测试一次。
FilterName:“过滤器名称”。
FilterObjece:“过滤对象”,“标题过滤”填1,“评论过滤”填2。
FilterType:“过滤器类型”,“简单替换”填1,“高级过滤器”填2。
FilterContent:“内容”。
FisString:“开始标签”,仅在设置“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。
FioString:“结束标签”,仅在设置“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。
FilterRep:即“替换”。
Flag:即“使用”,TRUE 为“启用”,FALSE 为“禁用”。
PublicTf:“应用程序类别”。TRUE 是“公共”,FALSE 是“私人”。
最后说一下使用filter函数实现伪原创的使用感受:
老Y文章管理系统的这个功能可以在采集时自动伪原创,但是功能不够强大。例如,我的网站上有三栏:“第一栏”、“第二栏”和“第三栏”。我希望“Column 1”对标题和文本都执行伪原创,“Column 2”只会对文本执行伪原创,“Column 3”只会执行伪原创@ > 在标题上。
所以,我只能做以下设置(假设我有 30000 条同义词规则):
为“第1列”的标题伪原创创建30000条替换规则;
为“第1列”的正文伪原创创建30000条替换规则;
为“Column 2”的文本伪原创创建30000条替换规则;
为“第三列”的标题 伪原创 创建 30,000 条替换规则。
这将导致数据库的巨大浪费。如果我的站点有十列,并且每一列都有不同的目标请求,那么这个数据库的大小会很糟糕。
因此,建议下一个版本的旧Y文章管理系统改进这个功能:
先添加批量导入功能,毕竟改数据库是有一定风险的。
其次,过滤规则不再依赖于某一个网站列,而是独立打出过滤规则,在新建采集项目时,参与判断是否使用过滤规则。
相信,经过这样的修改,可以大大节省数据库存储空间,逻辑结构也更加清晰。
本文为《我的网赚日记-原创网赚博客》原创,请尊重我的劳动成果,转载请注明出处!另外,本人使用旧的Y文章管理系统时间不长,文中如有错误或不当之处,欢迎指正!
相关文章: