文章定时自动采集(一下如何利用老Y文章管理系统采集时自动完成伪原创)
优采云 发布时间: 2021-08-29 20:04文章定时自动采集(一下如何利用老Y文章管理系统采集时自动完成伪原创)
垃圾站站长最希望的是网站可以自动采集,自动补完伪原创,然后自动收钱。这是世界上最幸福的事情,哈哈。不会讨论自动采集 和自动收款。今天来介绍一下如何使用旧的Y文章管理系统采集时自动补全伪原创。
旧的Y文章管理系统使用起来简单方便,虽然功能没有DEDE之类的强大。几乎是变态(当然,旧的Y文章管理系统是用asp语言写的,好像没有可比性),但是该有的都有,而且还挺简单的,所以有了也受到了很多站长的欢迎。老Y文章管理系统采集时自动补全伪原创的具体方法还是很少讨论的。在老Y论坛上,甚至有人在卖这种方法。有点鄙视。
关于采集,我就不多说了。我相信每个人都能应付。我想介绍的是旧的Y文章管理系统是如何在采集的同时自动完成伪原创的工作的。大体思路是利用旧的Y文章管理系统的过滤功能,自动替换同义词,从而达到伪原创的目的。比如我想把采集文章中的“网转博客”全部换成“网转日记”。详细步骤如下:
第一步是进入后台。编程客栈找到“采集管理”-“过滤器管理”,添加新的过滤器项。
我可以创建一个名为“网赚博客”的项目,具体设置请看图片:
“过滤器名称”:填写“网赚博客”即可,也可以随意写,但为了方便查看,建议与替换词保持一致。
“项目”:请根据你的网站选择一个网站列(必须选择一个列,否则过滤后的项目无法保存)
“过滤对象”:编程旅馆中的选项为“标题过滤器”和“文本过滤器”。一般选择“文本过滤器”。如果你想伪原创甚至标题,你可以选择“标题过滤器”。
“过滤器类型”:可用选项有“简单替换”和“高级过滤器”,一般选择“简单替换”,如果选择“高级过滤器”,则需要指定“开始标记”和“结束标记” ”,这样就可以在代码层面替换来自采集的内容。
“使用状态”:选项为“启用”和“禁用”,不作解释。
“使用范围”:选项为“公共”和“私人”。选择“私人”,过滤器只对当前网站列有效;选择“Public”,对所有列都有效,不管采集任何列中的任何内容,过滤器都是有效的。一般选择“私人”。
“内容”:填写将被替换的“网赚博客”字样。
“替换”:填写“网赚日记”,这样只要采集的文章中收录“网赚博客”二字,就会自动替换为“网赚日记”。
在第二步中,重复第一步的工作,直到所有同义词都添加完毕。
有网友想问:我有3万多个同义词,要不要手动一一添加?什么时候加! 不能批量添加吗?
好问题!手动添加确实是一个几乎不可能完成的任务,除非你有非凡的毅力,你可以手动添加这三万多个同义词。可惜旧的Y文章管理系统没有提供批量导入的功能。但是,作为真实的、有经验的、有思想的优采云,我们必须有优采云的意识。
注意我们刚刚输入的内容是存放在数据库中的,老Y文章管理系统是用asp+Access编写的,mdb数据库可以轻松编辑!于是乎,直接修改数据库就可以批量导入伪原创替换规则了!
改进的第二步:批量修改数据库和导入规则。
经过搜索,我发现这个数据库在“你的管理目录\cai\Database”下。使用 Access 打开此数据库并找到“过滤器”表。你会发现我们刚刚添加的替换规则就存放在这里。根据您的需要分批添加!接下来的工作涉及到Access的操作。
解释“过滤器”表中几个字段的含义:
FilterID:自动生成,无需输入。
ItemID:列ID是我们手动输入时“item”的内容,但是这里是数字ID,注意匹配采集ID列,如果不知道ID,可以重复第一步并测试一次。
FilterName:“过滤器名称”。
FilterObjece:“过滤对象”,“标题过滤器”填1,“文本过滤器”填2。
FilterType:“过滤器类型”,“简单替换”填1,“高级过滤器”填2。
过滤器内容:“内容”。
FisString:“开始标签”,仅在设置了“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。
FioString:“结束标签”,只有在设置了“高级过滤器”时才有效。如果设置了“简单过滤器”,请留空。
FilterRep:“替换”。
Flag:“使用状态”,TRUE 表示“启用”,FALSE 表示“禁用”。
PublicTf:“使用范围”。 TRUE 表示“公开”,FALSE 表示“私有”。
最后说一下使用过滤功能实现伪原创的体验:
老Y文章管理系统的这个功能可以实现采集时Auto伪原创,但是功能不够强大。例如,我的网站上有三列:“第一列”、“第二列”和“第三列”。我希望“第一列”到伪原创 标题和正文,“第二列”到伪原创 只针对正文,“第三列”到伪原创 只针对标题。
所以,我只能进行以下设置(假设我的同义词规则为 30,000):
为“第一列”伪原创的标题创建30000条替换规则;
为“第一列”伪原创的正文创建30000条替换规则;
为“第二列”伪原创的body创建30000条替换规则;
为“第三列”的标题伪原创创建30,000条替换规则。
这造成了巨大的数据库浪费。如果我的网站有几十个栏目,每一个栏目的需求都不一样,这个数据库的大小会很吓人。
所以建议旧版Y文章管理系统下个版本对这个功能做一些改进:
先添加批量导入功能,毕竟修改数据库有一定的危险。
编程旅馆
其次,过滤规则不再附属于网站列,而是独立于过滤规则,并且在新建采集项目时,增加了是否使用过滤规则的判断。
相信经过这个修改,可以大大节省数据库存储空间,逻辑结构也更加清晰。
本文为“我的网赚日记-原创网帮博客”原创,请尊重我的劳动成果,转载请注明出处!另外,我已经很久没有使用旧的Y文章管理系统了。文中如有错误或不妥之处,请指正!
本文标题:老Y文章管理系统采集Auto伪原创详细解决方案