事实:非专业人士,或不清楚规则采集器列表算法太复杂
优采云 发布时间: 2022-10-18 20:12事实:非专业人士,或不清楚规则采集器列表算法太复杂
免规则采集器列表算法太复杂,不便为非专业人士提供非专业人士,或不清楚技术原理,例如传统信息化很多人是没听说过任何新兴信息化工具,很多软件程序是半吊子水平,或不清楚规则采集,关键还是得先学习下他们的原理.
你要搞明白搜索引擎的关键是什么,不是搜索,是你能理解搜索的意义,转化,再把这种意义应用到搜索上,这是需要训练的。关键是把你应用搜索的问题转化成常识,你要明白这些常识:搜索是通过一种方式告诉用户,你要做什么你要找的结果是什么,而不是通过直接输入命令获得结果。另外,你应该了解下,搜索是一个很复杂的工作,也是个体力活,能够在单位时间内做到极致才能出成绩,而不是忽悠用户。
信息整合分类,对搜索效率和质量的影响会很大,你要做,就要做好。我写过一篇文章:一篇文章带你了解搜索引擎中关键字类型的搜索策略。
搜索的时候最简单的方法就是要弄明白该词的含义,把自己想要的信息信息整合成概括性的表达。这个叫提取关键字。比如:淘宝可以搜索:地址/淘宝(拼音)。不能搜索:美国/淘宝(拼音)。你搜索的时候要明白,用户想要的是什么。或者说用户在得到该词时,想要得到的结果是什么。但是。搜索的时候用户是不知道自己想要什么的。
不能出现空格等,否则用户会将搜索指向一些不可信的地方。所以如果要解决问题,你需要搞明白,用户在得到该词时,想要获得什么信息。如果写一个python爬虫,爬取淘宝全网用户搜索的关键字的图片。你就需要关注用户搜索的用词,以及用词之间的关系。然后就会对你自己想要的用词提取进行优化。这是把关键字信息整合的基础。
但你要搞明白。你的词与其他词之间的关系,以及你要将哪些关键字发送到搜索引擎。关键词要根据你实际需要,然后组合成一个长短句。或者一个整体的短句。