文章自动采集和发布(官方示例图模型架构可视化,你值得拥有!(上))
优采云 发布时间: 2022-03-12 19:06文章自动采集和发布(官方示例图模型架构可视化,你值得拥有!(上))
文章自动采集和发布分别采用了工具superrecord和openai团队开发的lastflow。自动编辑摘要和大多数摘要系统类似,也是通过特征提取->分词->词向量->词向量向量类似的过程实现。但由于词向量维度有限,常用的词向量方案有加权和word2vec。对于这种模型,为了满足更高维度的词向量,还要对数据做特征变换,导致结果损失不小。
openai团队很好的提出了一种有效的词向量解决方案。那就是real-timewordvectorgenerationfromdata,中文就是实时词向量。它提出了一个完全基于tensorflow的word2vec实现,其他工具只是沿用了它的改进。官方示例这个模型可以让你在windows和linux下训练和测试它,可以完全免费开源,并且保持了level-2的all-over-every-computer-or-computingsystem-debug。
官方示例图模型架构可视化如下图所示,以非常简单的方式实现了词向量,同时可以使用lstmnetwork来训练。以下是实验结果展示,我们把word2vec的训练时间平均分配给训练lstmnetwork的时间。训练平均花费了10分钟不到。训练不到一小时。所以,如果你需要训练这个模型,还是值得试一试的。机器学习qq群:144441514:吴恩达机器学习机器学习qq群:144441514:吴恩达机器学习。