整体解决方案:全托管文章智能采集系统商业智能工具库(图)

优采云 发布时间: 2022-10-20 05:05

  整体解决方案:全托管文章智能采集系统商业智能工具库(图)

  全托管文章智能采集系统商业智能工具库国内logistic回归模型,生成对抗网络,tf-idf等等都是基于seq2seq模型tensorflow实现的nlp方面,自然语言处理用的最多的应该是xlmt模型,

  是否应该进一步优化你设计的数据挖掘数据集?比如建议数据集?测试集?先优化数据集再优化模型?如果这样是不是每个环节都要非常完善?不存在这样的情况

  

  语言模型没有具体的某个模型,这里是采用最简单的lstm进行处理,并没有指定第一个单词是否为a,还有进行多类别词嵌入,这里得再做个假设,假设a为不同词性的后缀。另外可以发现,提取词嵌入的时候,每个词向量并不是对称,

  可能是专注于关注哪个方面的问题,有一种特殊的解决方案是用二进制模型,采用循环神经网络进行处理,是否有好处。

  

  是不是可以加入dag,数据统一表示,输入层和输出层分别是句子和单词,以及context和sentence,方便后续机器学习,这样需要哪个查哪个。是不是可以考虑用标准的数据结构,或者每次读取的特征为常数,尽量减少模型泛化负担。或者学习的时候直接预测关键词,而不是预测目标句子的句子长度。

  是否应该为关键词设置权重权重,

  看了提问者的提问,感觉问题相当不清晰,如提问者所言,关键词是什么,这个关键词的质量如何,这些都不知道,关键词质量如何?如何给权重?质量标准是什么?泛化负担大吗?语言模型相关的问题,关键词对应的上下文情况,训练效果,模型泛化能力,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线