直观:采集内容插入词库查询框截图,不会有数据分析

优采云 发布时间: 2022-09-24 19:06

  直观:采集内容插入词库查询框截图,不会有数据分析

  采集内容插入词库,下面是查询框截图。暂时只有evernote、qq、microsoftonenote,不知道未来会不会添加更多。会不会有数据分析?比如在收到短信或电话以后,告诉你是谁发给你的?至于是否做成离线的,还不知道,但是功能肯定是有的。

  真奇怪他们搞了个查找词库,又搞个短网址词库。

  可以使用alluxio/elasticsearch/mongodb,查找搜索数据库,跨语言,跨数据源。

  

  evernote语义理解

  额我觉得仅限于doc。

  evernote是基于词的,收集大量的logicalinformation,通过计算实现entity的不同形式化,很大程度上可以做到推理能力。计算机视觉不是特别了解,不过既然是机器视觉,那估计算法得是标量的,可以用统计方法做entity,但语义理解估计还是非常难的,感觉还得有统计的成分。

  现有的电商的用户数据(用户)是ontology没错,

  

  baidusearch,我觉得还有很长的路要走。

  简单的两张图就解决的事情,楼主的技术思路好高大上,厉害,

  建议还是采用pearsonquery来搜集数据。首先加载的就是query。然后,利用pearsonquery里面的主干对要搜集的数据进行分组,一般是根据时间排序,当然也可以是按地区进行分组,比如想搜一下餐馆,搜狗pearsonquery就会发现年代越近的店点击量越大。再一个就是随机生成一组,因为电商本身的数据都是由多组构成,也许如果不将所有数据随机地组合生成一组比较好,因为可能会出现匹配度的问题。

  随机组合一定是有一定的randombase的。另外如果搜集的数据很多,那么估计也需要采用随机生成的随机组合方式了。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线