智能识别,一键采集而有代码可以整理形成词典?
优采云 发布时间: 2022-06-20 21:04智能识别,一键采集而有代码可以整理形成词典?
智能识别,一键采集而有代码可以整理形成词典(每一个词有唯一的一个id),再自己转换为搜索词库,这样就可以通过关键词去定位你想要的内容了。
这一切的基础是互联网,ai*敏*感*词*地形成共识,形成词汇表,再由它去判断是否要形成数据库。
这个问题要复杂地多,不是一个人能做出来的,要的是积累,不是某一个人造的,也要考虑到某种技术是否能适应特定用户。中国处于社会主义初级阶段,应该建立各个行业的共识,建立行业数据库,建立行业网址导航(google必然是行业网址导航的鼻祖),必要时,应该开放各种系统接口,让各种方式的人参与进来。
根据搜索习惯,分词、归词、tag语义判断:id及类型识别;需求触发词、停止词(lukingvoice等)。
现有的图像识别技术应该也是很关键的因素。
1:数据本身,不论是基于ai的语音、图像识别,还是基于非ai的文本、小视频识别,都有很多的前提性要求。一个关键数据来源,是否可用于数据采集,一个可用性,是否具有一定的样本库(例如数学手段搜寻的,可参考md5值链式防伪技术),一个可搜寻的规律(通过关键词、词库规律等等),以及识别成功的可视化数据。这里面大概每一步都有无数的技术、深坑,基本都需要花费非常高的成本和精力。
2:硬件+专用识别硬件很重要。对于新的识别模式,硬件提供者的性能/成本优势更重要。智能硬件是一个大坑。