自动采集文章文章(一下如何利用老文章管理系统使用简单、方便,大体的思路)

优采云 发布时间: 2021-08-30 20:02

  自动采集文章文章(一下如何利用老文章管理系统使用简单、方便,大体的思路)

  垃圾站站长最希望的是网站可以自动采集,自动补完伪原创,然后自动收钱。这真的是世界上最幸福的事情了,哈哈。不讨论自动采集 和自动收款。今天介绍一下老的文章管理系统如何使用,简单方便,虽然功能没有DEDE之类的强大。几乎变态(当然,老Y文章Management系统是用asp语言写的,好像没有可比性),但是都有,而且还挺简单的,所以也受到了大家的欢迎很多站长。老的文章管理系统采集自动补全伪原创的具体方法还是很少讨论的。在旧论坛上,甚至有人在出售这种方法。我鄙视它。关于采集,我就不多说了,相信大家都能搞定。我要介绍的是旧的Y文章管理系统是如何在采集的同时自动完成伪原创的工作的。具体方法和大致思路是利用文章管理系统的过滤功能自动替换同义词,从而达到伪原创的目的。比如我想把采集文章中的“网转博客”全部换成“网转日记”。详细步骤如下: 第一步,进入后台。找到“采集管理”-“过滤器管理”,添加一个新的过滤器项。我可以创建一个名为“网赚博客”的项目,具体设置请看图片: “过滤器名称”:填写“网赚博客”,也可以随意写,但为了方便查看,建议和替换的话是一致的。

  “主题”:请根据您的网站选择网站列(必须选择列,否则无法保存过滤项)“过滤对象”:选项为“标题过滤”和“文本”过滤器“”,一般选择“文本过滤器”,如果要伪原创连标题,可以选择“标题过滤器”。“过滤器类型”:选项有“简单替换”和“高级过滤器”,一般选择“简单替换”,如果选择“高级过滤器”,则需要指定“开始标签”和“结束标签”,这样采集来的内容在代码层面被替换。“使用状态”:选项分别是“启用”和“禁用”,不作解释。 “使用范围”:选项有“公共”和“私人”。选择“私人”,过滤器只对当前网站列有效;选择“公共” 》,对所有栏目都有效,不管采集任何栏目有什么内容,过滤都有效。一般选择“私有”。“内容”:填写“网赚博客”字样进行替换。“替换” : 填写“网赚日记”,所以只要采集的文章收录“网转博客”字样,就会自动替换为“网转日记”。第二步,重复第一步的工作,直到添加完所有同义词。有网友想问:我有3万多个同义词,要不要手动一一添加?什么时候加! 不能批量添加吗?好问题!手动添加确实是一个几乎不可能完成的任务,除非你有非凡的毅力,你可以手动添加这三万多个同义词。

  遗憾的是,旧的文章管理系统没有提供批量导入功能。但是,作为真实的、有经验的、有思想的优采云,我们必须有优采云的意识。要知道,我们刚刚输入的内容是存放在数据库中的,老Y文章管理系统asp+Access写的,mdb数据库可以轻松编辑!于是乎,直接修改数据库就可以批量导入伪原创替换规则了!改进的第二步:批量修改数据库和导入规则。经过搜索,我发现这个数据库在“你的管理目录\cai\Database”下。使用 Access 打开此数据库并找到“过滤器”表。你会发现我们刚刚添加的替换规则就存放在这里。根据您的需要分批添加!接下来的工作涉及到Access的操作,就不啰嗦了,大家自己动手吧。解释“过滤器”表中几个字段的含义: FilterID:自动生成,无需输入。 ItemID:列ID是我们手动输入时“item”的内容,但是这里是数字ID,注意列对应的采集ID,如果不知道ID,可以重复第一步,测试一个FilterName:即“过滤器名称”。 FilterObjece:“过滤对象”,“标题过滤器”填1,“文本过滤器”填2。

  FilterType:“过滤器类型”,“简单替换”填1,“高级过滤器”填2。 FilterContent:“内容”。 FisString:“开始标签”,只有在设置了“高级过滤器”时才有效,如果设置了“简单过滤器”,请留空。 FioString:“结束标签”,仅在设置了“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。 FilterRep:即“替换”。 Flag:即“使用状态”,TRUE为“启用”,FALSE为“禁用”。 PublicTf:“使用范围”。 TRUE 表示“公共”,FALSE 表示“私有”。最后说一下使用过滤功能实现伪原创的体验:文章管理系统的功能可以实现采集时Auto伪原创,但是功能不够强大。例如,我的网站上有三列:“第一列”、“第二列”和“第三列”。我希望“第一列”到伪原创 标题和正文,“第二列”到伪原创 仅用于正文,“第三列”到伪原创 仅用于标题。因此,我只能做以下设置(假设我有30,000个同义词规则): 为“第一列”伪原创的标题创建30,000个替换规则;为“第一列”伪原创的正文创建30,000条替换规则;为“第二列”的正文伪原创创建30000条替换规则;为“第三列”的标题伪原创创建30,000个替换规则。

  这造成了巨大的数据库浪费。如果我的网站有几十个栏目,而且每个栏目的要求都不一样,这个数据库的大小会很吓人。所以建议老Y文章管理系统下个版本完善这个功能:一是增加批量导入功能,毕竟修改数据库有一定的风险。其次,过滤规则不再附属于网站列,而是独立于过滤规则,并且在新建采集项目时,增加了是否使用过滤规则的判断。相信这样的修改可以大大节省数据库存储空间,逻辑结构也会更加清晰。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线