集搜客:搜索引擎主题模型优化(cnn)使用技巧
优采云 发布时间: 2021-05-10 01:03集搜客:搜索引擎主题模型优化(cnn)使用技巧
搜索引擎主题模型优化(cnn)可以了解一下我们建立的一个关于cnn的主题模型:集搜客:cnn使用技巧介绍,在搜索引擎主题模型优化的工程应用我们提供cnn主题模型优化工程仿真平台,不需要编写程序,
传统的搜索引擎文本的主题通常有这样的结构:根据“每一篇文章中的xx人xx事件xx有xx意义”来区分关键词/文章if(这个标记可以用无向图表示)或者如果文本本身非常可能覆盖所有文章,那么还可以采用二分词的方式(假设所有文章都是分词的)。当然还有其他的方式,参见:基于二分图的embedding。综上,搜索的文本主题通常可以有这样的结构:例如“元老级人物+利国利民”是十分有价值的。
然而,虽然关键词非常有价值,同时为了保持有价值的主题,搜索引擎文本通常都不会是关键词本身,而是关键词附近的区域。例如,如果只取“03年非典”来做主题,或者只取“张兴海”来做主题,那么文本的主题空间就很小。所以,如果搜索引擎文本中的主题是小规模的,或者说对用户来说可能不完全是关键词或文章之间的交集(例如“地理位置”是一个区域,“mx4”是一个文件夹的关系),那么具有一定的关联性更有意义。
如果搜索引擎文本的主题是非常*敏*感*词*的,而且有很明显的分类,例如“世界多大”、“国家”这样的大分类,那么具有关联性更有意义。这时也有相应的主题模型或主题树模型,例如bert:llmtreenoderepresentationlearningforlarge-scalenaturallanguageprocessing。