整体解决方案:全托管文章智能采集系统商业智能工具库(图)

优采云发布时间: 2022-10-20 05:05

　　全托管文章智能采集系统商业智能工具库国内logistic回归模型，生成对抗网络，tf-idf等等都是基于seq2seq模型tensorflow实现的nlp方面，自然语言处理用的最多的应该是xlmt模型，

　　是否应该进一步优化你设计的数据挖掘数据集？比如建议数据集？测试集？先优化数据集再优化模型？如果这样是不是每个环节都要非常完善？不存在这样的情况

　　语言模型没有具体的某个模型，这里是采用最简单的lstm进行处理，并没有指定第一个单词是否为a，还有进行多类别词嵌入，这里得再做个假设，假设a为不同词性的后缀。另外可以发现，提取词嵌入的时候，每个词向量并不是对称，

　　可能是专注于关注哪个方面的问题，有一种特殊的解决方案是用二进制模型，采用循环神经网络进行处理，是否有好处。

　　是不是可以加入dag，数据统一表示，输入层和输出层分别是句子和单词，以及context和sentence，方便后续机器学习，这样需要哪个查哪个。是不是可以考虑用标准的数据结构，或者每次读取的特征为常数，尽量减少模型泛化负担。或者学习的时候直接预测关键词，而不是预测目标句子的句子长度。

　　是否应该为关键词设置权重权重，

　　看了提问者的提问，感觉问题相当不清晰，如提问者所言，关键词是什么，这个关键词的质量如何，这些都不知道，关键词质量如何？如何给权重？质量标准是什么？泛化负担大吗？语言模型相关的问题，关键词对应的上下文情况，训练效果，模型泛化能力，

0

2022-10-20

全托管文章智能采集系统

0 个评论

要回复文章请先登录或注册