自动采集文章文章(一下如何利用老Y文章管理系统采集时自动完成伪原创)

优采云 发布时间: 2022-03-20 23:16

  自动采集文章文章(一下如何利用老Y文章管理系统采集时自动完成伪原创)

  作为垃圾站站长,最有希望的是网站可以自动采集,自动完成伪原创,然后自动收钱,这真是世上最幸福的事, 呵呵 。自动采集 和自动收款将不予讨论。今天给大家介绍一下如何使用旧的Y文章管理系统采集自动补全伪原创的方法。

  旧的Y文章管理系统使用简单方便,虽然功能没有DEDE之类强大到近乎变态的地步(当然旧的Y文章管理系统是用asp语言写的,好像没有可比性。),但它应有尽有,而且相当简单,因此也受到很多站长的欢迎。老Y文章管理系统采集时自动补全伪原创的具体方法很少讨论。在老Y的论坛上,甚至有人推销这种方法,所以我很鄙视。.

  采集我就不多说了,相信大家都能做到,我要介绍的是旧的Y文章管理系统是如何同时自动完成伪原创的采集具体工作方法,大意是利用老Y文章管理系统的过滤功能,实现同义词的自动替换,从而达到伪原创@的目的>。比如我想把采集文章中的“网赚博客”全部换成“网赚日记”。详细步骤如下:

  第一步是进入后台。找到“采集管理”-“过滤器管理”,添加一个新的过滤器项。

  我可以创建一个名为“净赚博客”的项目,具体设置请看图片:

  

  “过滤器名称”:填写“网赚博客”即可,也可以随意写,但为了方便查看,建议与替换词保持一致。

  “项目”:请根据您的网站选择一列网站(必须选择一列,否则无法保存过滤项目)

  “过滤对象”:选项有“标题过滤”和“文本过滤”。一般可以选择“文本过滤器”。如果你想伪原创连标题,你可以选择“标题过滤器”。

  “过滤器类型”:选项有“简单替换”和“高级过滤”。一般选择“简单替换”。如果选择“高级过滤”,则需要指定“开始标签”和“结束标签”,以便在代码级别替换采集中的内容。

  “使用状态”:选项有“启用”和“禁用”,无需解释。

  “使用范围”:选项为“公共”和“私人”。选择“Private”,过滤器只对当前网站列有效;选择“Public”,对所有列有效,无论采集任一列的任何内容,过滤器都有效。一般选择“私人”。

  “内容”:填写“网赚博客”,要替换的词。

  “替换”:填写“网赚日记”,只要采集的文章中收录“网赚博客”这个词,就会自动替换为“网赚日记”。

  第二步,重复第一步的工作,直到添加完所有同义词。

  有网友想问:我有3万多个同义词,需要手动一一添加吗?那是时候添加了!? 不能批量添加?

  好问题!手动添加确实是几乎不可能完成的任务,除非你有非凡的毅力手动添加这三万多个同义词。遗憾的是,旧的 Y文章 管理系统没有提供批量导入的功能。然而,作为真正的资深人士,思考优采云,我们需要了解优采云。

  要知道我们刚才输入的内容是存储在数据库中的,而旧的Y文章管理系统是用asp+Access写的,mdb数据库也可以轻松编辑!所以,我可以直接修改数据库批量导入伪原创替换规则!

  改进第二步:批量修改数据库和导入规则。

  经过搜索,我发现这个数据库位于“你的管理目录\cai\Database”下。用Access打开数据库,找到“Filters”表,你会发现我们刚才添加的替换规则都存放在这里,根据你的需要,批量添加!接下来的工作涉及到Access的操作,我就不罗嗦了,大家自己动手吧。

  解释一下“Filters”表中几个字段的含义:

  FilterID:自动生成,无需输入。

  ItemID:列ID,是我们手动输入时“我们所属的Item”的内容,但这里是数字ID。请注意,它对应于列的 采集ID。如果不知道ID,可以重复第一步,测试一下。.

  FilterName:“过滤器名称”。

  FilterObjece:即“过滤对象”,“标题过滤”填1,“文本过滤”填2。

  FilterType:“过滤器类型”,“简单替换”填1,“高级过滤器”填2。

  FilterContent:“内容”。

  FisString:“开始标签”,仅在设置“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。

  FioString:“结束标签”,仅在设置“高级过滤器”时有效,如果设置了“简单过滤器”,请留空。

  FilterRep:即“替换”。

  flag:即“使用状态”,TRUE为“启用”,FALSE为“禁用”。

  PublicTf:“使用范围”。TRUE 是“公共”,FALSE 是“私人”。

  最后说一下使用过滤功能实现伪原创的心得:

  老Y文章管理系统的这个功能可以在采集时自动伪原创,但是功能不够强大。例如,我的网站上有三栏:“第一栏”、“第二栏”和“第三栏”。我希望“第 1 列”对标题和正文执行 伪原创,“第 2 列”仅对正文执行 伪原创,而“第 3 列”仅对 伪原创 执行标题。

  所以,我只能做以下设置(假设我有 30,000 条同义词规则):

  为“第一栏”的标题伪原创创建30000条替换规则;

  为“第1列”的正文伪原创创建30000条替换规则;

  为“第2列”的正文伪原创创建30,000条替换规则;

  为“第三列”的标题 伪原创 创建 30,000 条替换规则。

  这将导致数据库的巨大浪费。如果我的网站有几十个栏目,每个栏目的要求都不一样,那么这个数据库的大小会很吓人。

  因此,建议下一个版本的旧Y文章管理系统改进这个功能:

  先添加批量导入功能,毕竟修改数据库是有一定风险的。

  其次,过滤规则不再附属于某个网站列,而是独立于过滤规则,在新建采集项目时,增加了是否使用过滤规则的判断。

  相信经过这样的修改,可以大大节省数据库存储空间,逻辑结构也更加清晰。

  本文为《我的网赚日记-原创网赚博客》原创,请尊重我的劳动成果,转载请注明出处!另外,我已经很久没有使用旧的 Y文章 管理系统了。文中如有错误或不当之处,敬请指正!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线