伪原创词库(什么是伪原创?简单点来说,原文章的原创文章)
优采云 发布时间: 2021-12-22 20:14伪原创词库(什么是伪原创?简单点来说,原文章的原创文章)
文章伪原创什么是工具生产伪原创?
简单的说,经过处理原创文章,你得到的文章和原来的文章 原创文章意思差不多。常用于网站发帖、自媒体创作、媒体处理等。由于个人用户的创作经验有限,为了达到自己的目的,需要采用伪原创的方法
常见的伪原创平台
有付费平台也有免费平台,效果可能不尽如人意吧?
伪原创原理
最正确的方式当然是人工智能中自然语言处理的分支。使用语言模型进行分词,计算词义相似度,集成DNN语言模型(句子流畅度)等功能来达到目的。
核心功能:
实际应用
有趣的是,我以两种方式研究了每一种。
第二种方法虽然有点投机取巧,但是在文章伪原创上通过不同的路由是一样的
工具开发
材料:
实际操作先用PyQt5设计器画一个界面
在这里大致画出界面
完成的效果如下
生成py文件
绘制完成后按Ctrl+s保存为**.ui文件
在ui文件所在目录打开cmd,输入命令生成.py文件:pyuic5 -o fast-artcile.py fast-article.ui
然后你会看到一个同名的py文件。这时候复制py到项目中
打电话给谷歌翻译
初始化请求头,设置tkk值等。
def __init__(self):
self.url = 'https://translate.google.cn/translate_a/single'
self.TKK = "434674.96463358" # 随时都有可能需要更新的TKK值
self.header = {
"accept": "*/*",
"accept-language": "zh-CN,zh;q=0.9",
"cookie": "NID=188=M1p_rBfweeI_Z02d1MOSQ5abYsPfZogDrFjKwIUbmAr584bc9GBZkfDwKQ80cQCQC34zwD4ZYHFMUf4F59aDQLSc79_LcmsAihnW0Rsb1MjlzLNElWihv-8KByeDBblR2V1kjTSC8KnVMe32PNSJBQbvBKvgl4CTfzvaIEgkqss",
"referer": "https://translate.google.cn/",
"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36",
"x-client-data": "CJK2yQEIpLbJAQjEtskBCKmdygEIqKPKAQi5pcoBCLGnygEI4qjKAQjxqcoBCJetygEIza3KAQ==",
}
self.data = {
"client": "webapp", # 基于网页访问服务器
"sl": "auto", # 源语言,auto表示由谷歌自动识别
"tl": "vi", # 翻译的目标语言
"hl": "zh-CN", # 界面语言选中文,毕竟URL都是cn后缀了,就不装美国人了
"dt": ["at", "bd", "ex", "ld", "md", "qca", "rw", "rm", "ss", "t"], # dt表示要求服务器返回的数据类型
"otf": "2",
"ssel": "0",
"tsel": "0",
"kc": "1",
"tk": "", # 谷歌服务器会核对的token
"q": "" # 待翻译的字符串
}
with open('token.js', 'r', encoding='utf-8') as f:
self.js_fun = execjs.compile(f.read())
翻译,注意返回的内容是数组,数组需要拼接回字符串
def query(self, q, lang_to=''):
self.data['q'] = urllib.parse.quote(q)
self.data['tk'] = self.js_fun.call('wo', q, self.TKK)
self.data['tl'] = lang_to
url = self.construct_url()
req = urllib.request.Request(url=url, headers=self.header)
response = json.loads(urllib.request.urlopen(req).read().decode("utf-8"))
# 拼接数据
targetText = []
results = response[0]
for result in results:
if result[0]:
targetText.append(result[0])
# 将数组转成字符
str = '\n'.join(targetText)
originalText = response[0][0][1]
originalLanguageCode = response[2]
print("翻译前:{},翻译前code:{}".format(originalText, originalLanguageCode))
print("翻译后:{}, 翻译后code:{}".format(str, lang_to))
return originalText, originalLanguageCode, str, lang_to
为界面中的按钮添加事件
# 绑定 开始 事件
self.pushButton.clicked.connect(self.startTrans)
添加事件处理方法
def startTrans(self):
# 这里写处理逻辑
# 1. 获取用户输入的源文本
# 2. 将文本 中 译 英, 然后 英 译 中
# 3. 将伪原创之后的内容设置回结果输入框即可
pass
这样一个伪原创工具就完成了
项目源代码
项目源码,托管在github上,部分谷歌翻译内容,参考GitHub中的项目
项目成品
如果有闪烁的黑窗,应该是打包为exe时没有填写参数
成品下载
方法一:关注vx公众号,GitHub精心挑选,回复“伪原创”即可下载,不限次数,永久免费。如果tkk失败,可以回来查看项目更新。
方法二:根据源码包自行打包
尖端
如果您报告病毒,则是正常的。只要不是在360上发布,安全管家等安全平台都会上报病毒。可以添加信任,或者暂时关闭杀毒软件