采集文章系统(一下如何利用老Y文章管理系统采集时自动完成伪原创)
优采云 发布时间: 2021-10-27 12:19采集文章系统(一下如何利用老Y文章管理系统采集时自动完成伪原创)
垃圾站站长最希望的就是网站可以自动采集,自动补完伪原创,然后自动收钱。这真是世界上最幸福的事情了,哈哈。自动采集 和自动收款将不再讨论。今天给大家介绍一下如何使用老Y的文章管理系统采集自动完成伪原创。
旧的Y文章管理系统使用起来简单方便,虽然功能不如DEDE之类的强大。几乎是变态(当然,老Y文章管理系统是用asp语言写的,好像没有可比性。),但是该有的都有,而且还挺简单的,所以也受到了很多站长的欢迎。老Y文章管理系统采集时自动完成伪原创的具体方法目前还很少讨论。在老Y的论坛上,甚至有人在卖这个方法。我鄙视它。.
关于采集,我就不多说了,相信大家都能搞定。我要介绍的是旧的Y文章管理系统如何在采集的同时自动完成伪原创的具体工作方法,大体思路是使用过滤功能旧的Y文章管理系统实现同义词自动替换,从而达到伪原创的目的。比如我想把采集文章中的“网转博客”全部换成“网转日记”。详细步骤如下:
第一步是进入后台。找到“采集管理”-“过滤管理”,添加一个新的过滤项。
我可以创建一个名为“网赚博客”的项目,具体设置请看图片:
“过滤器名称”:填写“网赚博客”即可,也可以随意写,但为了方便查看,建议与替换词保持一致。
“项目”:请根据自己的网站选择一列网站(一定要选择一列,否则过滤后的项目无法保存)
“过滤器对象”:可用选项有“标题过滤器”和“文本过滤器”。一般选择“文本过滤器”。如果你想伪原创 连标题,你可以选择“标题过滤器”。
“过滤器类型”:选项有“简单替换”和“高级过滤器”,一般选择“简单替换”,如果选择“高级过滤器”,则需要指定“开始标签”和“结束标签”,以便你可以在代码层面替换 采集 中的内容。
“使用状态”:选项为“启用”和“禁用”,不作解释。
“使用范围”:选项为“公共”和“私人”。选择“私有”,过滤器只对当前网站列有效;选择“Public”,对所有列都有效,不管采集的任何列有什么内容,过滤器都有效。一般选择“私人”。
“内容”:填写要替换的“网赚博客”。
“替换”:填写“网转日记”,所以只要采集的文章中含有“网转博客”二字,就会自动替换为“网转日记”。
第二步,重复第一步的工作,直到添加完所有同义词。
有网友想问:我有3万多个同义词,要不要手动一一添加?什么时候加!? 不能批量添加吗?
好问题!手动添加确实是一个几乎不可能完成的任务,除非你有非凡的毅力,你可以手动添加这三万多个同义词。遗憾的是,旧的Y文章 管理系统并没有提供批量导入的功能。但是,作为真实的、有经验的、有思想的优采云,我们必须有优采云的意识。
要知道,我们刚刚录入的内容是存放在数据库中的,老Y文章管理系统是用asp+Access编写的,mdb数据库可以轻松编辑!于是乎,直接修改数据库就可以批量导入伪原创替换规则了!
改进的第二步:批量修改数据库和导入规则。
经过搜索,我发现这个数据库在“你的管理目录\cai\Database”下。使用 Access 打开此数据库并找到“过滤器”表。你会发现我们刚刚添加的替换规则就存放在这里。根据您的需要分批添加!接下来的工作涉及到Access的操作。
解释一下“过滤器”表中几个字段的含义:
FilterID:自动生成,无需输入。
ItemID:列ID是我们手动输入时“item”的内容,但这里是数字ID,注意对应列采集ID,如果不知道ID,可以重复第一步,测试一下。.
过滤器名称:“过滤器名称”。
FilterObjece:“过滤对象”,“标题过滤”填1,“文本过滤”填2。
FilterType:“过滤器类型”,“简单更换”填1,“高级过滤器”填2。
FilterContent:“内容”。
FisString:“开始标签”,只有在设置了“高级过滤器”时才有效,如果设置了“简单过滤器”,请留空。
FioString:“结束标签”,仅在设置了“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。
FilterRep:即“替换”。
Flag:“使用状态”,TRUE 表示“启用”,FALSE 表示“禁用”。
PublicTf:“使用范围”。TRUE 表示“公共”,FALSE 表示“私有”。
最后说一下使用过滤功能实现伪原创的使用感
经过:
老Y文章管理系统的这个功能在采集为伪原创时可以自动实现,但功能不够强大。例如,我的网站上有三列:“第一列”、“第二列”和“第三列”。我希望“第一列”伪原创 标题和正文,“第二列”伪原创 仅文本,“第三列”伪原创 仅标题。
因此,我只能进行以下设置(假设我有一个 30,000 同义词规则):
为“第一列”伪原创的标题创建30000条替换规则;
为“第一列”伪原创的文本创建30000条替换规则;
为“第2列”伪原创的文本创建30000条替换规则;
为“第三列”伪原创 的标题创建 30,000 条替换规则。
这造成了巨大的数据库浪费。如果我的网站有几十个栏目,而且每个栏目的要求都不一样,这个数据库的大小会很吓人。
所以建议旧版Y文章管理系统下个版本对这个功能做一些改进:
先添加批量导入功能,毕竟修改数据库有一定的危险性。
其次,过滤规则不再附属于某个网站列,而是独立于过滤规则,并且在新建采集项目时,增加了是否使用过滤规则的判断。
相信经过这样的修改,可以大大节省数据库存储空间,逻辑结构也更加清晰。
本文为《我的网赚日记-原创网专博客》原创,请尊重我的劳动成果,转载请注明出处!另外,我也很久没有用过旧的Y文章管理系统了。文章如有错误或不妥之处,还望指正!
感谢陆奇的贡献