采集文章系统(一下如何利用老Y文章管理解统采集时自动完成伪原创)
优采云 发布时间: 2021-11-13 05:05采集文章系统(一下如何利用老Y文章管理解统采集时自动完成伪原创)
站长交易()帮助站长赚钱虚拟主机评测+IDC导航=IDC123.COM
垃圾站站长最希望的就是网站可以自动采集,自动补完伪原创,然后自动收钱。这是世界上最不幸的事情。哈哈。自动采集 和自动收款将不再讨论。今天给大家介绍一下如何使用老Y文章管理解系统采集自动完成伪原创的方法。
旧的Y文章管理解决方案系统虽然功能没有DEDE之类的强大,但是使用起来简单方便。几乎变态(当然,老Y文章管理解决方案系统是用asp语言写的,好像没有可比性),但是该有的都有,而且还挺简单的,所以也受到了很多站长的欢迎。老Y文章管理解决方案采集时自动完成伪原创的具体方法目前还很少讨论。在老Y的论坛上,竟然有人兜售那个方法,有点不屑。一度。
至于采集,我就不多说了,相信大家都能搞定。我要介绍的是老的Y文章管理方案如何在采集伪原创的同时自动完成工作的具体方法,大体思路是用老的Y文章通过解决方案自带的过滤功能来管理隐藏同义词的自动替换,从而达到伪原创的目的。比如我想把采集文章中的“网转博主”全部换成“网转日记”。详细步骤如下:
我可以创建一个名为“网赚博主”的项目,具体设置请看图片:
“过滤器名称”:填写“网赚博主”即可,也可以随意写,但为了方便查看,建议与替换词保持一致。
“项目”:请根据自己的网站选择一列网站(一定要选择一列,否则过滤后的项目无法保存)
“过滤器对象”:可用选项有“标题过滤器”和“文本过滤器”。一般选择“文本过滤器”。如果你想伪原创 连标题,你可以选择“标题过滤器”。
“过滤器类型”:可用选项有“简单替换”和“高级过滤器”,一般选择“简单替换”,如果选择“高级过滤器”,则需要指定“开始标签”和“结束标签”,所以那你可以在代码层面替换采集中的内容。
“使用状态”:选项为“启用”和“禁用”,不作解释。
“适用范围”:选项为“私人”和“私人”。选择“私有”,过滤器只对当前网站列有效;选择“Private”,对所有列都有效,不管采集的任何列有什么内容,过滤器都是有效的。一般选择“私人”。
“内容”:填写“网赚博主”替换的词。
“替换”:填写“网转日记”,所以只要采集的文章中含有“网转博主”二字,就会自动替换为“网转日记”。
第二步,重复第一步的工作,直到添加完所有同义词。
FilterRep:即“替换”。
这个答案很好!手动添加确实是一个几乎不可能完成的任务,除非你有非凡的毅力,你可以手动添加30000多个同义词。遗憾的是,旧的Y文章 管理方案系统并没有提供批量导入的功能。但是,作为诚实、有经验、有思想的勤奋人,我们必须有勤奋的意识。
要知道,我们刚刚中奖的内容是存放在数据库中的,老Y文章管理方案是用asp+Access编写的,mdb数据库可以轻松编辑!于是乎,我可以直接修改数据库批量导入伪原创替换规则!
改进的第二步:批量修改数据库和导入规则。
搜索后发现数据库在“你的管理目录\cai\Database”下。使用 Access 打开该数据库并找到“过滤器”表。你会发现我们刚刚添加的替换规则就存储在那里。根据您的需要分批添加!接下来的工作涉及到Access的操作。
解释一下“过滤器”表中几个字段的含义:
FilterID:自动生成,无需win。
ItemID:列ID是我们手动中奖时“item”的内容,但是有数字ID,注意列对应的采集ID,如果不知道ID,可以重复第一步并测试一次。
过滤器名称:“过滤器名称”。
FilterObjece:“过滤对象”,“标题过滤”填1,“文本过滤”填2。
FilterType:“过滤器类型”,“简单更换”填1,“高级过滤器”填2。
FilterContent:“内容”。
FisString:“开始标记”,只有设置了“高级过滤”时才有效。如果设置了“简单过滤”,请留空。
FioString:“结束标签”,只有设置了“高级过滤器”时才有效。如果设置了“简单过滤器”,请留空。
有网友想回答:我有3万多个同义词,要不要手动一一添加?什么时候加!? 不能批量添加吗?
Flag:即“操作状态”,TRUE为“启用”,FALSE为“禁用”。
PublicTf:“适用范围”。TRUE 表示“私有”,FALSE 表示“私有”。
最后说一下使用过滤功能隐藏伪原创的经验:
旧的Y文章管理方案系统可以在采集自动隐藏伪原创时自动隐藏,但功能不够强大。例如,我的站点上有三列:“第一列”、“第二列”和“第三列”。我希望“第一列”伪原创 标题和正文,“第二列”伪原创 仅文本,“第三列”伪原创 仅标题。
因此,我只能进行以下设置(假设我有 30,000 的同义词规则):
为“第一列”伪原创的标题创建30000条替换规则;
为“第一列”伪原创的文本创建30000条替换规则;
为“第2列”伪原创的文本创建30000条替换规则;
为“第三列”伪原创 的标题创建 30,000 条替换规则。
这将造成巨大的数据库浪费。如果我的网站有几十个栏目,每一个栏目都需要不同的提供,那么数据库的大小会非常可怕。
因此,建议旧版 Y文章 管理方案的下一版本对该功能进行一些改进:
最后添加批量导入功能,毕竟修正数据库有一定的危险。
其次,过滤规则不再附属于某个网站列,而是独立于过滤规则,在新建采集项目时,参与判断是否使用过滤规则。
相信经过这样的修改,可以大大节省数据库存储空间,逻辑结构也显得更加清晰。
本文为《我的网赚日记-原创网赢博主》原创,请尊重我的劳动成果,转载请注明出处!另外我用了很久的老Y文章来管理统一时间。文章如有错误或不妥之处,敬请指正!
感谢陆奇的贡献
文章编辑于: