伪原创相似度查询( “伪原创”手段有哪些?(图)调查动机互联网内容 )
优采云 发布时间: 2021-09-17 13:19伪原创相似度查询(
“伪原创”手段有哪些?(图)调查动机互联网内容
)
素描/高跃
调查动机
互联网内容制作市场日趋激烈,高质量的原创内容可以说是互联网上的“战场”。在此背景下,很多平台都推出了在线工作应用原创功能,这不仅可以保护原创作者的合法权益,还可以促进高质量内容的不断涌现。然而,许多人瞄准"k9"市场,制作"K1"作品。“伪原创”是什么意思?《法制日报》的记者展开了调查
内容制作无疑是当前互联网经济的一个主要“出口”。传统媒体改革者和自媒体人都将内容制作视为互联网经济的一座富矿,文本、视频、音频和其他产品继续出现在各种网络平台上
由于它是内容生产,涉及内容的版权,从而导致网络作品的盗版和侵权现象。然而,与传统盗版相比,在线原创作品仍然面临着一种新的侵权形式——“K1”,即通过各种手段将原作者的原创作品转化为侵权人的原创
“伪原创”的意思是充满了诡计
刘思翰目前正在工作,主要负责公司制作内容的版权保护
“我们是一家从事科普和知识视频的新媒体公司。我们在微信和微博等多个平台上发布医药、汽车等领域的内容。我们制作的每个原创内容包括三个部分,视频、详细的旁白解说和相对简单的文本,”刘思翰说
一个原创的内容收录三个部分:视频、音频和文本,不容易被别人“拿走”,但刘思涵恰恰遇到了这种情况
2016年12月27日,刘思翰的公司上传了一篇关于原创汽车外观的文章。“今年2月中旬,一个微信公众号发布了一个文章,使用了我们原创视频的截图,复制粘贴了文本,并将画外音整理成文字。在此基础上,剽窃者在开头添加了一张文章的图片和来自互联网的图片。这样,另一方就将我们的原创内容变成了int刘思翰说。p>
刘思翰在微信的背景下与对方协商,但对方不承认。之后,刘思翰的公司向平台投诉,要求对方删除稿件。对方回答:“既然你们都抱怨了,我们就把它交给站台吧。”
刘思翰说:“这不仅是我们关于这辆车被剽窃的官方报道,而且我们还发现并报告了我们每周制作的其他领域的一些剽窃视频。”。p>
记者调查发现,互联网上仍有许多"k1"剽窃方式。例如,“草稿清洗”是将几个类似的物品文章放在一起,然后申请“原创”
目前,通用平台审查机制主要由机器完成,即根据文本内容的比例判断是否存在剽窃。然而,机器审查的一个弱点是很难识别视频和*敏*感*词*
“我们公司主要制作*敏*感*词*或视频。剽窃者直接拍摄视频截图,并将原创文章中的文本内容转换成图片。没有文字,机器很难识别剽窃,”刘思翰说,“我们与粉丝的互动是问答式的。读者的留言中会有一些问题,我们会在互动中回答。我了解到,一些公众人物甚至复制了我们与读者互动的内容,并将这些问题和答案转移到他们自己身上文章."
自动在线生成“伪原创”
在调查中,记者发现,除了刘思翰提到的各种"K1"方式外,还有另一种方式,即在线自动生成"K1"
记者通过阅读和试用,梳理了几款"K1"工具的*敏*感*词*和原理,"K1"的目的是让搜索引擎认为它是一款"K9"K7",从而提高搜索结果的排名@“工具或在线生成网站都有自己的同义词库,其中一些是通过免费模式向用户开放的,而另一些较大的同义词库则只有在用户付费后才能使用
“在互联网上复制的文章可以通过伪原创立即变成你自己的原创文章”。一个伪原创“网站描述说。这种伪原创”工具也可以用来植入关键词或读者希望在文章中看到的网站,以实现宣传作用
报告器复制并粘贴原创文章到此类网站上,只需单击一下即可生成同义词文章。被替换的单词通常用不同的字体和颜色标记
在这个过程中,记者发现专业的文章被替换的较少;生命文章取代了更多的单词;“K7”越长,替换率越高。在线“伪原创”该工具还附带在线工具,如相似性检测、关键词排序、关键词统计和关键词组合工具。文章整体置换比例约为10%。替换后文章的可读性降低,建议网站手动修改文章以提高可读性。描述中有一个“伪原创”网站“最好用自己的语言组织文章的开头和结尾,这样效果会更好。”
记者使用相似性检测来比较原创和“伪原创”,发现机器识别的相似性介于85%和98%之间
记者在网站上看到一条生成的记录。内容文本字符长度为734个单词,共替换44个单词,长度为90个字符,替换率为12.26%. 原创版本和替换版本之间的文章相似性为92.6%,那么这么高的相似度呢?这些网站给出了进一步的“解决方案”
“在线生成文章并将其粘贴到伪原创'文章的最后一段,该段已在前两个步骤中完成”。记者点击“generate文章online”,发现生成的文章不可读,但似乎是一个中文乱码。将此乱码粘贴在文章的末尾,以减少与的相似性84.3%
除了使用乱码来减少相似性,这些网站介绍还说,图片也可以插入文章中,建议用户中断文章的顺序
此外,记者还发现,互联网上可以搜索到大量关于"如何制作"K1"的教程
原创维权仍然很麻烦
如果作者的原创内容被“伪原创”剽窃,会有什么损失
“就商业价值而言,文章广告的价格取决于官方账户的金额。公众号越大,标题“k7”去年的价格约为5万元。剽窃我们的官方账户,估计标题文章的价格在几千到两万或三万元之间。保守估计也可以卖几千美元。”刘思翰说
刘思翰告诉记者,从背景数据来看,如果是关于原创的热点问题,剽窃的作品可能会对原创产生至少一周的影响。对于科普内容来说,大部分都没有时效性,剽窃对原创的影响持续时间更长
面对"K1"侵权行为,"K9"侵权人有没有想过维护自己的权利,该如何保护自己的权利?
“对于原创作者来说,他们需要投入大量精力来制作高质量的内容,他们需要花费大量精力来保护自己的权利。特别是对于个人原创作家来说,也许这一天或一周非常鼓舞人心,他们可以写一篇特别好的文章. 结果,他们被剽窃了,也许他暂时什么也做不了,”刘思翰说
刘思翰表示,对于该公司来说,剽窃后的主要诉求是让对方删除文章信息。“我们会不时在后台搜索关键词,看看是否有未经授权的转载。如果没有授权,即使有人标记我们的公共名称,我们也会联系对方文章将其删除。大多数剽窃者都是有罪的,他们会删除手稿。如果他们不删除,更有效的方法是向平台报告”
记者从调查中了解到,"K9"报告在不同平台的处理周期不同,有的平台"K9"作者当天投诉,处理结果在几小时内发布,有的平台的审核过程会比较麻烦",公司和机构需要出示一份公司声明,说明哪篇文章文章已被复制,并应盖章、扫描和上传。整个过程只需两到三天,甚至更长时间。”刘思翰说,“采取法律手段保护原创获得赔偿,对公司和机构来说,太耗费精力,也不经济。”
刘思翰的公司建立了“全网”运营渠道,无论发现哪个平台剽窃,都可以联系平台方,删除剽窃文章.“但是,对于个人原创而言,该项目无法完成。首先,他们的工作平台非常有限,不可能与许多平台合作来保护他们的原创. 第二,他们没有精力交流。”刘思翰说
最近,一个平台推出了一个名为“版权保护补偿”的功能,这意味着通过后台与平台签订协议。如果发生剽窃,平台将帮助原创