谷歌翻译算原创文章吗?伪原创就是黄金的经历
优采云 发布时间: 2021-08-20 05:02
谷歌翻译算原创文章吗?伪原创就是黄金的经历
让我们做一个比喻。如果采集的内容是纯银,那么伪原创就是金,我们写原创的时候就是*敏*感*词*。它闪耀着耀眼的光芒,但相比之下,我们知道*敏*感*词*是非常稀有且难以形成的,所以我们在创造“*敏*感*词*”时需要投入更多的经验!以下是关于原创、伪原创 和采集 的 6 个技术问答。
谷歌翻译算原创文章吗?
有网友问:要不要把中文文章翻译成英文,然后放到网站上算原创上?
扎克回答:
有两种情况。如果您使用谷歌翻译或其他自动翻译软件,只需在翻译后添加网站,而不是原创,这违反了谷歌的质量指南。 Google 员工已明确表示拒绝此类内容。
但是如果不是自动大量翻译,并且有一定的编辑润色,或者加了一定的值,还是不是原创,但是谷歌不一定会把翻译的内容当作垃圾邮件或作弊。
不同之处在于站长的意图:是将翻译软件视为一种自动生成大量内容的方法,还是帮助用户理解有意义的外语材料?这种方法被很多人用过,效果参差不齐,与域名权重、其他内容量、编辑参与度等诸多因素有关。
有网友问:我们的网站谷歌PR目前为0。翻译软件很好用,但我们确认流畅或稍作修改后才推出。那不也算原创吗?作为站长,我们的意图是增加网站访问者,增加粘性,增加权重。没有其他意图。当然,这个文章是本着可以帮助用户解决问题的态度发布的。
Zac 答:Google Toolbar 上的 PR 已经很久没有更新了,所以看不到最新的 PR 值。这没什么大不了的,也不代表页面的质量。你说的情况还是不是原创,但是谷歌可能识别不出来,如果修改了帮助用户解决某些问题,我觉得谷歌应该会喜欢。
采集Station 优化效果也很强,各位前辈怎么看?
网友提问:不好意思,克隆和小偷工具很多,采集站也很有效。 关键词rank、收录、权重都很高,比白帽优化还要好。各位前辈,你们怎么看这个问题?
扎克回答:
一些采集站有很好的排名效果,尤其是规模大,伪原创做得好的时候。但是可能还有更多的采集站不好用,我们通常也看不到它们。所以不能说采集站效果好,只能说效果好。
黑帽SEO和搜索引擎的博弈中,作弊和反作弊是不可避免的,恐怕短时间内不会消失。虽然谷歌的技术很强,但也有各种黑帽子网站row up。作为个人网站,尝试这种方法并没有错。公司网站需要非常谨慎。
文章编辑两次是否会被判定为采集?
有网友问:今年偶尔想做个网站,所以用WP建了个网站。因为是新站,百度收录也比较慢,很多内容经过两次编辑,原创很少,这种文章会不会被认作采集文章百度的?另外希望对代码优化和网站开发提出一些建议。
网友回答1:
采集 完全没问题,你经常百度一下,会看到很多基本一模一样的内容。可能没有办法处理它。如果都是原创,能搜到的东西就没有那么多了,搜索的准确性也很重要。当然原创是最好的,原创需要很多时间,而且很容易被采集掉线。
扎克回答 2:
你们所谓的二次编辑,不是采集吗?也许添加所谓的伪原创,穿插替换一些关键词,修改标题,改变段落顺序,或者整合多个来源采集的内容,等等。
你打算欺骗搜索引擎是可以理解的,如果你做得好,你可以欺骗他们。但是你不能对自己撒谎,你甚至不能认为第二次编辑真的离原创不远。您必须清楚地知道自己在做什么,才能更好地预测效果并承担后果。
适量的转载是可以的,但初期最好不要太大。在采集 的情况下,需要一些技巧。上面提到的伪原创可能还不够,文章的特性需要改关键词。
原创文章生成这样的工具,会不会对网站SEO产生不良影响?
有网友问:前不久看到神器“原创generation tool”,在百度上很好奇。发现这个工具生成的文章有几个基础:
1、使用搜索引擎和原创文章检测工具,均显示原创文章(100%);
2、生成的文章语句流畅,整篇文章和一般的原创文章没有区别;
能不能把这种文章放在网站上来填内容,会不会对网站SEO有不良影响?
扎克回答 1:
如果该工具生成的内容真的被搜索引擎认为是原创,就不会有不良影响。问题是,你如何愚弄搜索引擎?你怎么知道你是否欺骗了搜索引擎?
你提到的检测工具显示为原创文章。据我所知,搜索引擎官方还没有发布这样的工具。如果有第三方工具,准确性可能值得怀疑。很少有公司拥有搜索引擎。掌握数据量和计算技术。因此,在线检测工具标识为原创,搜索引擎不一定如此判断。
生成的文章语句流畅,最大可能是采集后拼接或者自动替换同义词。这种技术对于搜索引擎来说不难判断。当然,可能还有高级工具,我没见过。你说的原创生成工具和检测工具,可以告诉我叫什么名字,或者网站是哪个,我试试看,可能会有不同的结论。
扎克回答 2:
使用他们的在线演示版本生成一些文章 并查看。应该是采集、拼接、替换同义词的组合。虽然结果还不错,但还是有迹可循。比如我生成了几个文章,每一个都可以在网上找到原出处,但是在搜索原出处的时候,却搜索不到一个完整的句子,因为我也做了同义词替换(比如替换“后代” ”与“下一代”),搜索几个词,加双引号,即可找到出处。
也许网上的那些文章其实就是用这个工具生成的,被拍下来贴在网站上的?貌似可能性不大,因为网上看到的版本比工具流畅。例如,原文是“分泌紊乱是脱发的主要原因”,但该工具已被替换为同义词,改为“分泌紊乱是导致脱发的关键问题”。后一句不合理。
如果人们判断的话,不难判断是不是原创。原创出处很容易找到,替换什么词一目了然。我不确定搜索引擎现在是否可以判断它。将来肯定会奏效。
采集的内容会被当作垃圾堆处理吗?
有网友问:我在业余时间做了几个不同行业的小网站。比如其中一个是关于本地装修的,每天更新的都是网上找到的比较齐全实用的精品。 文章,如装修日记等,整理编辑后,纠正其中的错误,形成完美的内容。不过毕竟是采集的,不是原创的,我只是想让我的网站把散落在网上的特别好的精品文章采集起来。也有少数几个小领域网站,网站属于知识类。他们也在搜集整理行业内最好的内容,每天不间断地编辑一两篇文章。但不知道对搜索引擎来说是否有意义,是否会被当成垃圾站。
扎克回答:
这取决于您对编辑、排序和纠正错误所说的内容。如果只是在不同的地方拼贴网站,纠正一些错别字,恐怕还是会被搜索引擎视为复制内容,不一定是垃圾站,但更难获得排名和流量这种内容对搜索引擎没有意义。为什么要去你的网站查看网上已经存在的内容?单纯的采集文章,即使是文章的精华,也不是什么好的内容方式。
如果编辑比较精打细算,比如加入自己的评论和个人经验,并且占一定比例,那么就有一定的意义了。
伪原创怎么做?
有网友问:如果把三个文章里面的内容分成两到三个句子,再组合成一个新的文章,能算原创吗?
扎克回答:
不,做伪原创没那么简单,不然网上各种抄袭、转载都会变成原创,搜索引擎也没那么傻。
搜索引擎在判断文章是否为原创时,会计算内容的指纹,比如特征关键词的MD5哈希值计算。不同内容的指纹是不同的,相同的指纹意味着相同的内容。所以伪原创倒序等方法不起作用,因为关键词特征不能改变,指纹也不能改变。
计算指纹时,可以按段落甚至句子计算粒度。因此,如果您从不同的地方获取内容,则无法对其进行剪切和拼接。每个段落的指纹都是不变的。建议不要做所谓的伪原创,现在网络上的垃圾邮件已经够多了。