文章伪原创工具(文章伪原创工具制作什么是猫有付费平台)

优采云 发布时间: 2021-10-17 13:01

  文章伪原创工具(文章伪原创工具制作什么是猫有付费平台)

  文章伪原创工具制作

  什么是伪原创?

  简单的说,处理完原创文章后,得到一块原创文章,其含义与原来的文章类似。常用于网站发帖、自媒体创作、媒体处理等。由于个人用户的创作经验有限,为了达到自己的目的,需要采用伪原创的方法

  常见的 伪原创 平台

  5118

  牛奶托盘

  优采云

  有付费平台也有免费平台,效果可能不尽如人意吧?

  伪原创原理

  最正确的方式当然是人工智能中的自然语言处理分支。使用语言模型进行分词,计算词义相似度,集成DNN语言模型(句子流畅度)等功能来达到目的。

  核心功能:

  同义词、同义词替换

  保证句子流畅

  实际应用

  有趣的是,我以两种方式研究了每一种。

  第一,自然语言处理,利用百度AI的NLP开发了一个开源项目。项目地址:language-ai,这个可以达到目的,但是很快我就发现了问题,分词,DNN语言模型还不错,但是同义词,同义词替换这个也影响性能,对词库要求比较高。简单来说,伪原创 很慢

  二是使用语言翻译。我们都知道,一旦我们学过英语,有多重含义是很正常的。这是同义词最常见的地方。所以如果我们把中文翻译成英文,我们会得到文章 意思相近,而且每篇文章可能都不一样。然后再把英文翻译成中文,就可以补全同义词,替换同义词,效率很高,几千字的文章用不了多久。

  第二种方法虽然有点投机取巧,但是在文章伪原创上通过不同的路由是一样的。

  工具开发

  材料:

  蟒蛇3.8

  PyQt5

  其他依赖包

  实践

  先用PyQt5设计器画一个界面

  在这里大致画出界面

  完成的效果如下

  生成py文件

  绘制完成后按Ctrl+s保存为**.ui文件

  在ui文件所在目录打开cmd,输入命令生成.py文件:pyuic5 -o fast-artcile.py fast-article.ui

  然后你会看到一个同名的py文件。这时候复制py到项目中

  打电话给谷歌翻译

  初始化请求头,设置tkk值等。

  def __init__(self):

  self.url ='#39;

  self.TKK = "434674.96463358" # 有一个TKK值可能需要随时更新

  self.header = {

  “接受”: ”*/*”,

  "accept-language": "zh-CN,zh;q=0.9",

  “曲奇”: “NID = 188 = M1p_rBfweeI_Z02d1MOSQ5abYsPfZogDrFjKwIUbmAr584bc9GBZkfDwKQ80cQCQC34zwD4ZYHFMUf4F59aDQLSc79_L cms AihnW0Rsb1MjlzLNElWihv-8KByeDBblR2V1kjTSC8KnVMe32PNSJBQbvBKvgl4CTfzvaIEgkqss”,

  "推荐人": "",

  "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome /75.0.3770.142 Safari/537.36",

  "x-client-data": "CJK2yQEIpLbJAQjEtskBCKmdygEIqKPKAQi5pcoBCLGnygEI4qjKAQjxqcoBCJetygEIza3KAQ==",

  }

  self.data = {

  "client": "webapp", # 基于网页的访问服务器

  "sl": "auto", # 源语言,auto 表示谷歌自动识别

  "tl": "vi", # 翻译目标语言

  "hl": "zh-CN", # 界面语言为中文。毕竟网址后缀是cn,所以美国人是不会装的

  "dt": ["at", "bd", "ex", "ld", "md", "qca", "rw", "rm", "ss", "t"], # dt 表示要求服务器返回的数据类型

  "otf": "2",

  “塞尔”:“0”,

  "tsel": "0",

  "kc": "1",

  "tk": "", # 将被谷歌服务器检查的令牌

  "q": "" # 要翻译的字符串

  }

  with open('token.js','r', encoding='utf-8') as f:

  self.js_fun = 桩(f.read())

  翻译,注意返回的内容是数组,数组需要拼接回字符串

  def 查询(self, q, lang_to=''):

  self.data['q'] = urllib.parse.quote(q)

  self.data['tk'] = self.js_fun.call('wo', q, self.TKK)

  self.data['tl'] = lang_to

  url = self.construct_url()

  req = urllib.request.Request(url=url, headers=self.header)

  response = json.loads(urllib.request.urlopen(req).read().decode("utf-8"))

  # 拼接数据

  目标文本 = []

  结果=响应[0]

  结果结果:

  如果结果[0]:

  targetText.append(result[0])

  # 将数组转换为字符

  str ='\n'.join(targetText)

  原创文本 = 响应[0][0][1]

  原创语言代码 = 响应 [2]

  print("翻译前:{},翻译前代码:{}".format(originalText, originalLanguageCode))

  print("翻译后:{},翻译后代码:{}".format(str, lang_to))

  返回 originalText、originalLanguageCode、str、lang_to

  为界面中的按钮添加事件

  # 绑定开始事件

  self.pushButton.clicked.connect(self.startTrans)

  添加事件处理方法

  def startTrans(self):

  # 这里写处理逻辑

  # 1. 获取用户输入的源文本

  # 2. 将文本从中文翻译成英文,再将英文翻译成中文

  # 3. 设置伪原创后的内容回到结果输入框

  经过

  这样一个伪原创工具就完成了

  项目源代码

  项目源码,托管在github上,部分谷歌翻译内容,参考GitHub中的项目

  项目成品

  如果有闪黑的窗口,应该是打包为exe时没有填写参数

  成品下载

  方法一:关注vx公众号~,GitHub精心挑选,回复“伪原创”即可下载,不限次,永久免费。如果tkk失败,可以回来查看项目更新。

  方法二:根据源码包自行打包

  提示

  如果你报毒,这是正常的。只要不是在360发布,安全管家等安全平台就会报毒。可以添加信任,或者暂时关闭杀毒软件

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线