采集内容插入词库(如何把商品库整理成文字云图?如何在知乎上保存或获取对话框?)
优采云 发布时间: 2022-03-28 20:05采集内容插入词库(如何把商品库整理成文字云图?如何在知乎上保存或获取对话框?)
采集内容插入词库当然可以同时生成词云图。只是下次多提个问题,“如何在知乎分享图片?”如何做字体识别?如何把商品库整理成文字云图?如何在知乎上保存或获取对话框?希望能自己先想个办法。
字体识别截图识别
word2vec可以训练成词向量,把词向量训练好了,直接通过word2vec来提取文本中的特征。之后用文本特征就可以生成词云图,获取的词云图(词向量的矩阵)里面就包含了词语和词语之间的距离信息。很直观,很容易看出是否有相似之处,哪些是词语,
一个有效的方法就是通过深度学习把文本包装成特征向量,然后把特征向量通过主成分分析等降维之后训练一个分类器。最后把训练好的分类器作为分析的训练数据。将训练好的分类器的特征向量和作为输入数据进行下游分析。分析时使用标准的降维到n维向量,来减少非重要数据的影响。
如果是一些简单的无关注点词的话,有专门一种方法可以生成词云,不需要用到背景信息。下面分享一下我在word2vec里训练出来的词云生成的图片如下:首先需要先整理词云中的无关信息,因为word2vec中没有词向量需要我们自己去创建。我们的目的是训练好的词云对分析中对于一些无关注点词进行分析,也就是对于有很多无关注点词的词自动扩充成以词为维度的词云。
这里推荐两个地方:百度文库word2vec学习笔记在此里面不仅有学习资料还有文章对于一些无关注点词还提供了查询的入口。可以看下,希望对你有帮助。